MemU:专为 AI 伴侣设计的开源记忆框架 让 AI 助手/虚拟助手拥有像真人一样的长期记忆能力

MemU 是一个专为 AI 伴侣(AI companion)领域设计的 开源记忆框架,旨在帮助 AI 更像人类一样“记住你”,实现长期、上下文温馨且有逻辑的互动体验。 它专注于 AI 伴侣领域的长期记忆解决方案,通过结构化记忆、图谱构建、自我优化与动态遗忘机制,让 AI 能更自然地“记住你”。

2025-08-09 08:00 · opensource · goodinfo.net

GPT 5 Coding 编码案例库 含提示词

OpenAI 发布的一个演示仓库,收录了一系列 完全由 GPT-5 在单个提示中自动生成的演示应用(demo),旨在展示 GPT-5 在生成代码方面的能力,尤其是快速构建网站、前端应用、小游戏和交互式界面的能力。 这些例子都无需人工编写代码,完全由自然语言提示驱动生成 > 💡“只要你输入一

2025-08-08 08:00 · opensource · goodinfo.net

LiYing :一款专为普通照相馆设计的证件照后期AI自动化处理工具 可一键自动处理证件照任务

LiYing 是一款专为普通照相馆设计的证件照后期自动化处理工具,可以一键自动处理证件照任务,比如: - 自动抠图换白底/红底/蓝底 - 裁剪成标准证件照大小 - 输出排版好的多张照片 - 快速压缩、转码照片 - 整个过程几乎不需要手动操作,尤其适合对技术不熟悉的影楼从

2025-08-07 08:00 · opensource · goodinfo.net

OpenAI开源模型详细性能介绍:可在本地电脑等各种环境中运行 性能媲美o4-mini

OpenAI发布了两个开源模型:gpt-oss-120b和gpt-oss-20b,这是自2019年GPT-2发布以来首次推出开源语言模型,标志着其在开源AI领域的重大进展。 这些模型专为处理复杂任务而设计,允许开发者根据需要进行调整与优化。提供高度的定制化功能,适用于各种用例,并且可以在本地电脑

2025-08-06 08:00 · opensource · goodinfo.net

阿里巴巴推出全新图像生成模型:Qwen-Image 可以精准渲染中英文文字

阿里巴巴推出 一个超强图像生成AI模型:Qwen-Image ,200亿参数(20B),可以: - 生成图像 - 精细修改图像 - 最关键的是:它可以在图像中自然地渲染文字(中英文都行) 🧠 它厉害在哪? 🖋️ 1. 超强“图中文字”生成能力(尤其是中文) Qwe

2025-08-05 08:00 · opensource · goodinfo.net

FLUX.1 Krea [dev]:一个“有主见”、“有自己审美”的图像模型 解决AI图像和“过度饱和”和“AI 味”问题

Black Forest Labs(BFL)与 Krea AI 联合发布了最新的开源权重文本生成图像模型 —— FLUX.1 Krea [dev]。 该模型突破了传统 AI 图像模型中常见的“过度饱和”和“AI 味”问题,以更加真实、独特的视觉风格生成图像,被称为“有主见”的模型。 优势:

2025-08-01 08:00 · opensource · goodinfo.net

Google开源了一款专为程序员打造的字体:Google Sans Code 采用等宽设计 将几何精准度与书法风格完美融合

Google Sans Code 是由 Google 与 Universal Thirst 字体设计团队合作开发的一款 等宽字体(Monospaced Font),它采用等宽设计,将几何精准度与书法风格完美融合,即使在极小的代码编辑器中也清晰易读,告别眯眼… 专门为 编程、技术产品和开发者界面设

2025-08-01 08:00 · opensource · goodinfo.net

Lightricks发布开源AI视频生成模型:LTX-Video 13B 比同类模型快30倍 可在消费级GPU上运行

Lightricks发布开源AI视频生成模型:LTX-Video 13B。LTXV-13B采用创新的多尺度渲染方法,先以低分辨率生成视频的粗略运动和布局,再逐步细化细节。 这种分层处理显著提升了生成速度(比同类模型快30倍),同时保持高质量输出,减少内存需求。 核心特性: - 13

2025-07-17 08:00 · opensource · goodinfo.net

Google 开源GenAI Processors 可像搭积木一样轻松开发出复杂的 AI 应用

在构建基于大型语言模型(如 Gemini)的 AI 应用时,开发者通常面临以下难题: - 多模态输入(语音、图像、文本)流程复杂 - 需要组合多个异步 API 调用 - 数据处理逻辑零散、维护成本高 - 实时响应(如语音助手)性能难以保障 Google 发布了开源 Py

2025-07-11 08:00 · opensource · goodinfo.net

GPT-4o 对视觉理解有多深?在标准计算机视觉任务上评估多模态基础模型

像GPT-4o、Gemini、Claude这些模型,不光能聊天,还能“看图说话”。但是研究人员发现: 虽然它们能看图写文字,但并不清楚它们是否真的“理解”图像,比如: - 它能区分图像里不同的物体吗? - 它能知道哪个东西远哪个东西近吗? - 它能把一个图像“拆解”成不同的部分吗?

2025-07-09 08:00 · opensource · goodinfo.net