ChatTutor:可视化交互式AI教师系统

传统聊天式AI在教育中主要通过文本交互完成答疑,但这种方式的表现力有限,尤其在 STEM(科学、技术、工程、数学) 学科中,缺乏图形演示、公式推导与逻辑操作的支撑。 ChatTutor 的设计初衷正是弥补这一空白: > “为AI教师配备电子白板和交互工具,使其具备‘视觉教学’能力。”

2025-11-10 08:00 · opensource · goodinfo.net

StepFun AI 发布LLM 级别的音频编辑模型: Step-Audio-EditX 拥有 情绪、语气、风格、副语言特征编辑能力

StepFun AI (阶跃科技)发布 Step-Audio-EditX 语音开源模型,这是世界上第一个 LLM 级别的音频编辑模型。 它不仅能合成语音,还能编辑声音的情绪、语气、风格,让生成的语音更自然、更有表现力。 - 一个 基于大语言模型(LLM)架构 的音频模型; - 30亿参

2025-11-09 08:00 · opensource · goodinfo.net

Inworld TTS :能在0.25 秒内生成带情绪、语气、非语言细节的多语言语音模型 支持秒级声线克隆和实时对话流

Inworld TTS 是一款面向实时语音交互与数字角色开发的高端语音AI系统,集成: - Text-to-Speech(TTS)语音合成 - Voice Cloning(声音克隆) - 多语言与情感语音控制 - 实时流式生成(Streaming) - 非语言表达(no

2025-11-08 08:00 · opensource · goodinfo.net

notebooklm-skill :让 Claude Code) 可以直接查你在 NotebookLM 上的文档、笔记等

notebooklm-skill 是一个为 Claude Code开发的插件(Skill),用于让 Claude Code 能直接与 Google NotebookLM 通信。 它让 Claude Code(AI 编程助手) 可以直接查你在 Google NotebookLM 上上传的文档,比如

2025-11-04 08:00 · opensource · goodinfo.net

SoulX-Podcast :可以稳定生成90分钟多人对话播客的语音模型

SoulX-Podcast 是由 Soul AI Lab(Soul应用背后的AI实验室) 开发的 高保真播客生成推理框架,旨在从文本直接生成长篇、多说话人、对话式语音内容。 SoulX-Podcast : > 实现了高真实度、长时段、多说话人、多语种(中英双语 + 多方言)播客式语音生成,

2025-10-29 08:00 · opensource · goodinfo.net

ComfyUI 视觉中枢 + 智能相册 + 工作流追溯系统

Smart ComfyUI Gallery 是一款专为 ComfyUI 用户打造的智能文件管理与可视化工具 能以优雅、快速、移动友好的方式管理你用 ComfyUI 生成的所有图片和视频,并自动关联每个文件的生成“工作流(workflow)”。 ComfyUI 用户经常遇到以下问题:

2025-10-27 08:00 · opensource · goodinfo.net

会自己检查对不对的OCR AI2 推出第二代OCR 模型 :olmOCR 2

AI2(Allen Institute for AI) 发布的新一代光学字符识别模型 —— olmOCR 2。 它是一个将 PDF 文件、扫描文档和历史资料 转换为可编辑文本的 AI 模型,重点是处理传统 OCR 系统难以应对的 复杂文档结构和手写体识别问题。 olmOCR 2 在识别文档时,内

2025-10-26 08:00 · opensource · goodinfo.net

Tahoe-x1 (Tx1):能够理解 基因、细胞和药物之间关系的AI模型

美国生命科学公司 Tahoe Bio 发布了一款新的人工智能模型:Tahoe-x1(简称 Tx1)。 它是一个拥有 30亿参数(3B) 的大型基础模型(foundation model), 目标是让 AI 能够理解 基因、细胞和药物之间的关系。 简单来说,Tahoe-x1 想要让 AI “学

2025-10-25 08:00 · opensource · goodinfo.net

DeepSeek 发布了一个新型 OCR文档理解模型:DeepSeek-OCR 它不仅能解析图像文档 还探索了一个大胆的想法

DeepSeek 团队提出了一种新型 OCR(图像识字)文档理解系统:DeepSeek-OCR,它不仅能识别图片中的文字,还探索了一个大胆的想法: 👉 把长文本“压缩”成图片,让AI更高效地记忆和处理信息。 DeepSeek 团队称这种技术为: > “上下文光学压缩(Context Opt

2025-10-20 08:00 · opensource · goodinfo.net

Google 开发出一款肿瘤基因变异检测模型:DeepSomatic 支持多种测序技术与癌症类型检测

研究背景:AI 正进入癌症基因学的核心环节 癌症的本质是一种 基因调控失衡 导致的疾病。 当细胞的 DNA 损伤修复系统或分裂控制基因被突变破坏时, 细胞可能无限制分裂、逃避免疫系统、甚至入侵身体其他组织。 每种癌症都拥有独特的 基因突变组合(mutational signature),

2025-10-19 08:00 · opensource · goodinfo.net