Skip to content

【开源自荐】👾 AI 创作助手 - 将任意视频/音频 转化为各种风格的文章(可在本地部署) #6584

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Open
hanshuaikang opened this issue Apr 12, 2025 · 3 comments
Labels

Comments

@hanshuaikang
Copy link

hanshuaikang commented Apr 12, 2025

项目名称: AI-Media2Doc

🔥GitHub地址
https://github.com/hanshuaikang/AI-Media2Doc

项目特点

  • 完全开源[MIT]协议, 支持本地部署, 无需登录注册, 使用自己的大模型的 api key 即可,所有任务记录均保持在本地。
  • 支持视频音频文件一件转换成各种风格的文章并保留原始音频识别文本。
  • 支持生成 知识笔记/内容总结/小红书/微信公众号/思维导图 等风格的文档类型。
  • 支持针对视频内容进行 AI 实时对话。
  • 为有同样想法的朋友提供了可行的实施方案。

未来的计划

  • 支持更多的文档风格的输出, 例如架构图/流程图,字幕文件等。
  • 支持智能截取视频关键帧插入到文章中, 实现真正的图文并茂。
  • 支持通过 docker 的方式一键部署。

项目截图

只需要拖入已经下载好的视频文件,选择图文风格点击开始即可

Image

针对历史任务支持 ai 多轮对话, 方便提炼内容

Image

生成的思维导图支持一键下载导入到开源的思维导图进行编辑

Image

项目初衷

AI 视频创作助手源于我年初的一个想法, 作为一个喜欢阅读的人, 我更希望将一些视频内容转化为文字, 方便我进行二次阅读思考和总结记录笔记, 但市面上并没有一个好的工具来实现这个想法, 大多数工具都需要登录和付费, 我不太想在互联网上注册过多的账号, 同时也不想将自己想要总结的内容上传至除了云厂商之外的第三方平台,因此我开发了这个小应用,MIT 协议, 任何人都可以以极低的成本去体验音视频转文本。

@hanshuaikang hanshuaikang reopened this Apr 12, 2025
@hanshuaikang hanshuaikang changed the title 【开源自荐】AI 创作助手 - 将任意视频/音频 转化为各种风格的文章 【开源自荐】AI 创作助手 - 将任意视频/音频 转化为各种风格的文章(可在本地部署) Apr 12, 2025
@XcantloadX
Copy link

看起来好像必须用火山引擎的服务?有没有考虑过加入其他服务商?

@hanshuaikang
Copy link
Author

看起来好像必须用火山引擎的服务?有没有考虑过加入其他服务商?

有,正在开发中

@hanshuaikang hanshuaikang changed the title 【开源自荐】AI 创作助手 - 将任意视频/音频 转化为各种风格的文章(可在本地部署) 【开源自荐】👾 AI 创作助手 - 将任意视频/音频 转化为各种风格的文章(可在本地部署) Apr 14, 2025
@ruanyf ruanyf added the weekly label Apr 15, 2025
@hanshuaikang
Copy link
Author

hanshuaikang commented Apr 15, 2025

看起来好像必须用火山引擎的服务?有没有考虑过加入其他服务商?

下个阶段除了 llm 部分应该有考虑支持一些纯本地的大模型去实现语音转文本, 这样的话,就只剩下调用 llm 的成本,使用云厂商赠送的额度那么本地也可以用很久。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

3 participants