今天看啥  ›  专栏  ›  GitHubStore

Pipecat: 创建语音对话agent的开源框架,支持多模态!

GitHubStore  · 公众号  ·  · 2024-05-17 17:56
    

文章预览

项目简介 pipecat  是用于构建语音(和多模态)对话代理的框架。诸如私人教练、会议助理、儿童讲故事玩具、客户支持机器人、摄入流程和尖刻的社交伙伴。 看看一些示例应用:       语音代理入门 您可以开始在本地计算机上运行 Pipecat,然后在准备就绪后将代理进程移动到云中。您还可以添加📞电话号码、🖼️图像输出、📺视频输入、使用不同的 LLMs,等等。 # install the module pip install pipecat-ai # set up an .env file with API keys cp dot-env.template .env 默认情况下,为了最小化依赖关系,只有基本的框架功能可用。某些第三方 AI 服务需要额外的依赖项,您可以使用这些依赖项进行安装: pip install "pipecat-ai[option,...]" 您的项目可能需要也可能不需要这些,因此它们作为可选要求提供。下面是一个列表: AI services: anthropic, azure, fal, moondream, openai, playht ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览