📰 正文

一款基于 🍌Nano Banana Pro 与 Gemini 3 的一站式 AI 小红书图文生成器 slogan:“一句话一张图片,生成整套小红书内容”

RedInk 的核心目标是让用户仅通过一句自然语言描述(如“秋季显白美甲”),即可自动生成一整套 风格统一、排版清晰、可直接发布的小红书图文内容。

它解决了传统内容创作中:

图文匹配不一致、封面风格不统一;

内容撰写耗时长;

设计门槛高; 等问题。

一句话总结:

RedInk = “AI 自动撰稿 + AI 生成图片 + 封面设计 + 图文排版” 的一体化工具。

image

灵感来源?

作者最早灵感来自一个 Linux.do 社区帖子, 有人用“🍌Nano Banana Pro”(一个 AI 图像模型)来做 PPT。 他觉得:既然能自动生成 PPT,为什么不能生成小红书图文?

于是就诞生了 RedInk。 它的目标不是做“好玩”的东西,而是让:

内容创作变得像打字一样简单。

能做什么?

RedInk 让你可以:

输入一个主题(例如“春季穿搭指南”);

自动生成标题页 + 6 到 9 页的图文内容;

每一页都带有风格一致的图片和说明;

图片风格可以基于你的品牌或账号主页;

可以上传参考图片,让生成风格保持一致;

最后还能一键下载所有图片文件。

image

然后等待10-20秒后,就会有每一页的大纲,大家可以根据的自己的需求去调整页面顺序(不建议),自定义每一个页面的内容(这个很建议)

image

它会先生成封面,然后并发(同时)生成其他页面。

image

然后稍等一会儿后,会生成后面的所有页面(这里是并发生成的所有页面(最高25个),如果大家的API供应商无法支持高并发的话,记得要去改一下设置)

image

如果你的 API 支持高并发(比如 Google Gemini Pro 付费账号), 生成速度会非常快(一次最多 25 张图一起生成)。

用到的 AI 技术

RedInk 是一个“图文双引擎”的系统。 它用两个模型分别负责不同部分: 1.

Gemini 3:生成文字内容(标题、描述、段落);

🍌Nano Banana Pro:生成配图(封面、背景、图像元素)。

这两个模型配合在一起,就能让输出既有“文案逻辑”,又有“视觉风格”。

技术架构(怎么搭起来的)

整个项目是前后端分离的。

后端部分

用 Python 3.11+ 和 Flask 写的;

负责调用 Gemini 或 OpenAI 的 API;

管理任务队列、生成请求、并发控制。

前端部分

用 Vue 3 + TypeScript + Vite;

提供一个漂亮的 Web 界面;

用户可以在网页里输入主题、编辑每一页文案、点击生成图片。

依赖管理

Python 部分用 uv;

前端部分用 pnpm;

两者结合实现了轻量级开发与部署。

怎么用?(详细部署流程)

作者还没发布 Docker 镜像,但本地搭建很简单。

第一步:准备环境

你需要:

Python 3.11 或更高版本;

Node.js 18 或更高;

安装好 pnpm 和 uv。

第二步:克隆项目

git clone https://github.com/HisMax/RedInk.git
cd RedInk

第三步:配置 AI 服务

复制配置模板:

cp text_providers.yaml.example text_providers.yaml
cp image_providers.yaml.example image_providers.yaml

然后编辑文件:

在 text_providers.yaml 填入你的 Gemini 或 OpenAI 的 API Key;

在 image_providers.yaml 填入你的图像生成 API(可以用 Gemini Image 或 DALL·E 3)。

第四步:安装依赖

uv sync
cd frontend
pnpm install

第五步:启动后端

uv run python -m backend.app
# 默认运行在 http://localhost:12398

第六步:启动前端

cd frontend
pnpm dev
# 打开 http://localhost:5173

打开浏览器后,你会看到一个非常简洁的 Web 界面: 输入一句话、点“生成”,几秒后整个图文内容就会出现。


使用体验

生成流程非常清晰: 1.

输入主题;

系统自动生成 6~9 页大纲;

用户可手动调整或修改文字;

点击“生成图片”;

实时查看生成进度;

下载全部图片,一键导出。

图片的风格统一、配色协调、文字布局干净,非常适合直接用于社交媒体发布。


配置和参数(理解一下)

RedInk 可以用两种方式配置: ① Web 页面设置(推荐,界面可视化操作); ② YAML 文件手动配置(开发者用)。

你可以选择使用哪个模型(Gemini / OpenAI)。

可以控制生成并发(一次生成几张图)。

支持同时生成文字 + 图片。

如果你的 API 限制调用频率(比如 GCP 免费账户),可以关闭并发。

并发生成越高,生成越快,但 API 压力也越大。


注意事项

免费的 Gemini 试用账号不适合开启高并发,否则可能报错;

生成图片时页面不要关闭;

图片生成需要几秒钟时间;

如果出现错误,可以在终端查看日志。


项目进展与更新

最新版本(v1.1.0)更新了不少功能:

新增 Web 界面配置(不用手改配置文件了);

新增 高并发模式 开关;

API Key 会自动脱敏显示,保护安全;

支持配置实时保存;

优化图片加载性能,修复了部分 500 错误。

未来计划包括:

支持更多输出格式(PDF、长图等);

支持“一句话生成整套 PPT”;

改进历史记录与模板系统。


版权与授权

RedInk 采用 CC BY-NC-SA 4.0 协议:

允许学习、研究、个人使用;

不允许商业使用;

修改后的项目也必须继续开源。

如果你想商用(例如在你的 SaaS 产品中提供图文生成功能), 需要联系作者购买商业授权。

联系方式:

邮箱:histonemax@gmail.com

微信:Histone2024

GitHub:https://github.com/HisMax/RedInk


来源:基于 Nano Banana Pro的一站式小红书图文生成器