开源项目推荐

LangGPT 链接

LangGPT 项目旨在以结构化、模板化的方式编写高质量 ChatGPT prompt,维护了很多prompt教程、示例和模版等。

Awesome-ChatTTS

整理和汇总了 ChatTTS 项目的常见问题和相关资源,是 ChatTTS 的最佳入门指南. ChatTTS是目前很火的一个TTS模型,不过由于训练数据存在版权问题,所以没法商用。

STORM

STORM: Synthesis of Topic Outlines through Retrieval and Multi-perspective Question Asking。它根据互联网搜索从头开始编写类似维基百科的文章。
将生成带有引用的长文章分为两个步骤:

  • 预写阶段:系统通过互联网进行研究,收集参考资料并生成大纲。
  • 写作阶段:系统使用大纲和参考文献生成带有引文的全文文章。

STORM 认为研究过程自动化的核心是自动提出好的问题。直接提示语言模型提出问题效果并不好。为了提高问题的深度和广度,STORM 采用了两种策略:

  • 观点引导提问:给定输入主题,STORM 通过调查类似主题的现有文章来发现不同的观点,并使用它们来控制提问过程。
  • 模拟对话:STORM 模拟维基百科作者和基于互联网资源的主题专家之间的对话,使语言模型能够更新其对主题的理解并提出后续问题。

基于两个阶段的分离,STORM使用dspy以高度模块化的方式实现。

AntiFraudChatBot

AntiFraudChatBot是基于大规模预训练中文模型、语义识别与检测、对话意图等技术所构建的生成式对话QA框架,目前第一版模型针对反诈骗的场景化任务,对比传统的BertQA模型或non-prompt模型,在真实测试中AI对话的流畅度有明显提高。

RTranslator

RTranslator 是一款(几乎)开源、免费、离线的 Android 实时翻译应用程序。有对话模式、对讲机模式、翻译模式等。

Building optimized RAG with LlamaIndex + DSPy

详细介绍了Llamaindex与DSPY集成的使用方法。

技术介绍

REWOO框架Reasoning without Observation

Youtube视频:Llamaindex Vs Langchain Framework

吴恩达关于agenticflow的视频分享

Agentic设计模式

开发经验

架构模式

Generative AI Design Patterns using LLM

Generative AI Design Patterns: A Comprehensive Guide

Agentic RAG

Graph-RAG

其他

Orchestrating agentic systems 编排智能体系统

扩展阅读

AI and the American Smile
探讨了人工智能生成图像中人物表情的文化差异及其意义。作者认为,由于训练数据集主要来自于美国文化,人工智能生成的图像将文化差异简单化,呈现出一种单一的”微笑”表情,这掩盖了不同文化背景下表情的多样性和内在含义。
美国人希望公众人物对他们微笑,以此强调社会秩序和平静。另一方面,俄罗斯人认为公职人员在公共场合保持庄严的表情是适当的,因为他们的行为应该反映出其工作的严肃性。美国重要公众人物露齿的“霸道微笑”激发了美国人的信心和承诺。相反,俄罗斯人期望领导人表情严厉,以表现出“严肃的意图、有效性和可靠性”。
一些文化中认为未来是不确定的,微笑——一种与自信相关的行为——是不可取的。俄罗斯文化在避免不确定性方面排名非常低,俄罗斯人对笑脸的智力评价明显低于其他文化。
来自政府腐败程度较高的国家的人们更有可能将笑脸视为不诚实。

AI生成的美洲原住民战士的照片

真实的1865年美洲原住民酋长照片

AI生成的古代波利尼西亚战士的自拍片

毛利人是新西兰(奥特罗亚)的土著波利尼西亚人民,他们真实的传统毛利战舞仪式照片

AI生成的摆出自拍姿势的苏联士兵

东欧士兵自拍的真实照片

AI 生成的二战美国海军军官自拍照图像

二战时期的美国海军军官真实招聘

2018 年,罗切斯特大学的研究人员进行了一项实验,旨在了解欺骗与面部表情之间的关系。参与者被分成描述者和询问者角色。描述者被展示了一张图像,并要求他尽可能详细地记住它。然后他们被指示向审问者说谎或真实描述他们刚刚看到的东西,而审问者并不知道给描述者的指示。在151对个体参与者之间的记录交流中,产生了130万帧面部表情。然后,研究人员使用机器学习自动寻找模式。在没有任何预先确定的标签或类别的情况下,结果识别出最常与说谎相关的表情:一个“高强度版本”的杜兴笑容——一个扩展到脸颊/眼睛和嘴巴肌肉的笑容(19世纪,杜兴在治疗一个因为肌营养不良导致面部表情丧失的病人时,发现用电刺激面部的相关肌肉收缩能够产生特定的表情。比如刺激眼角与颧骨附近的肌肉运动组合,便使病人产生了微笑的表情,此后这被称做“杜兴微笑”)。

阿拉巴马州斯普林希尔学院 (Spring Hill College) 教授理论、性别和跨文化交流的克里斯蒂娜·科切米多娃 (Christina Kotchemidova) 认为,紧张,痛苦,虚伪的狰狞表情——现代美国的微笑——源于 18 世纪的一场巨大的情感转变。但这也是建立在谎言之上的。他认为,在这种转变之前,美国的情感景观围绕着悲伤和忧郁等负面情绪,这些情绪被视为同情心和高尚的象征。受宗教改革前和早期欧洲基督教思想的启发,美国人和欧洲人都认为尘世的苦难是崇高的,并且是幸福来世所必需的。这一时期的文学、视觉艺术和戏剧旨在激发悲伤,在欧洲,当众哭泣是司空见惯的事。
启蒙时代将文化推向了不同的方向。当思想家和艺术家接受理性时,他们也开始相信,在我们的尘世生活和来世,幸福是可以被允许的。悲伤的文化开始被快乐的文化所取代,这反过来又影响了阶级结构的变化。新兴中产阶级将管理情绪的能力视为其身份的关键。生意失败和疾病与情绪控制失败有关,而快乐与繁荣有关。最终,性格开朗成为就业的先决条件。

“面部‘表情’的概念意味着一种通过一系列面部动作寻求释放的内在感觉。 在将全球各种文明的面部表情多样性简化为一种单一、统一的视角时,AI将历史、文化、摄影和情感概念的广泛范围塌缩在一起。它呈现了一种关于某种普遍性的虚假视觉叙事,而在现实世界中——真实的人类在这里生活并创造了文化、表达和意义已经有几十万年的历史——这些都绝不是统一的。