AntV Infographic:一句话自动生成漂亮、结构化的信息图
AntV Infographic 是阿里巴巴 AntV 团队推出的一个新一代 信息图生成与渲染框架。 它的目标是: > “让文字变成图形,让数据开口说话。” 也就是说,你只需要输入几句话描述信息,系统就能自动生成一张漂亮、结构化的信息图(Infographic)。 ![image]
AntV Infographic 是阿里巴巴 AntV 团队推出的一个新一代 信息图生成与渲染框架。 它的目标是: > “让文字变成图形,让数据开口说话。” 也就是说,你只需要输入几句话描述信息,系统就能自动生成一张漂亮、结构化的信息图(Infographic)。 ![image]
阿里云 Tongyi Fun 团队 发布全新的开源语音大模型 Fun-Audio-Chat ,在实现 自然、低延迟的语音交互(Voice Interaction),专为实现自然、低延迟的语音交互而设计。 你不需要打字,只要用语音对它说话,它就能实时理解、思考、回答你,并用自然流畅的语音回复。
智谱 AI(Zhipu AI) 发布新一代多模态与智能体化模型:GLM-4.7。 该版本并非单纯参数扩容,而是针对 智能体场景中的“思考一致性(Thinking Consistency)”与“编程自治性(Agentic Coding)” 进行结构性增强。 该版本在多项标准化基准测试中显著超越
A2UI(全称 Agent-to-User Interface)是 Google 推出的一个开源项目,目标是让 AI 智能体(agent)能自动生成安全的图形化界面(UI)。 > 🧠 一句话解释: A2UI 是一种“让 AI 能说 UI 的语言”。 让智能体(Agents)能生成上下文相关
阿里巴巴旗下 Qwen 团队推出的一款创新图像生成与编辑模型:Qwen-Image-Layered。 其核心创新点在于: > 将单张图像自动分解为多个独立的 RGBA 图层,从而赋予图像“内在可编辑性”(inherent editability)。 这种分层结构使得每个图像元素(如前
Google 推出了一个新的 AI 模型,叫做 FunctionGemma。 它是 Google 自家的 Gemma 3 270M 模型 的一个特别版本,专为函数调用(Function Calling)任务优化的语言模型。 基于 Gemma 3 270M 模型进行二次微调(fine-tuni
SAM Audio 是 Meta 最新发布的 通用声音分离 AI 模型。 它可以理解并“分割”复杂音频中的任意声音元素,比如: - 🎸 一键提取歌曲中的吉他或人声; - 🚗 过滤户外视频的交通噪音; - 🐶 去除播客录音里的狗叫声。 这意味着 —— > “就像 Phot
传统机器人开发面临几个痛点: - 文档混乱,装配说明难以复现; - 工程师间协作分散(CAD、GitHub、数据系统都分开); - 缺少标准的方式共享硬件和数据; - AI模型训练难以结合现实操作数据。 Tnkr 想解决的就是这个问题: > 让机器人研发变得像开源
智谱 AI AutoGLM 团队宣布正式开放其核心项目 AutoGLM(Automated General Learning Model) 的全部源代码与模型。 什么是 AutoGLM AutoGLM 是一个让 人工智能能够自主使用智能手机 的系统。 它的核心理念是:AI 不应局限在对
GPT Newspaper 是一个由人工智能驱动的自动新闻生成系统。 它的目标是: > 根据用户的兴趣、喜好和偏好来源,自动创建属于你个人的“定制报纸”。 它会自动上网找新闻、写文章、排版、出版,让你每天收到只包含你感兴趣内容的个性化报纸。 这个项目基于 OpenAI GPT 模型