Imagen3-MCP 项目详细介绍
Imagen3-MCP 是一个基于 Google 最新的 Imagen 3.0 图像生成模型构建的工具,它通过实现 MCP (Model Control Protocol) 协议来提供图像生成服务。这意味着该工具可以作为支持 MCP 协议的第三方应用程序(例如特定的 IDE 或创意工具)的后端,接收文本提示并生成对应的图像。
核心功能与特点
- 基于顶尖模型: 利用 Google Imagen 3.0 的强大能力,生成高质量、富有创意且逼真的图像。
- 支持 MCP 协议: 可以方便地集成到兼容 MCP 的开发环境或应用程序中,实现流程化的图像生成工作流。
- 灵活配置: 支持通过环境变量进行多种配置,包括 API 密钥、代理设置以及服务器监听地址和端口。
效果示例
项目通过示例展示了 Imagen 3.0 的生成能力,可以根据详细的文本描述创造出符合预期的图像,甚至可以控制一些摄影参数:
- 示例 1:
画一只奔跑的杰克罗素犬,长焦镜头,阳光透过狗狗的毛发,照片级画质
- 对应英文描述:
A running Jack Russell Terrier, telephoto lens, sunlight filtering through the dog's fur, photorealistic quality
- 这个示例展示了生成逼真照片风格图像的能力,并能理解特定的镜头效果(长焦)和光线效果。
- 对应英文描述:
- 示例 2:
画一个科技感十足的苹果
- 对应英文描述:
A high-tech apple
- 这个示例则展示了生成概念性或风格化图像的能力。
- 对应英文描述:
使用要求
使用 Imagen3-MCP 工具的先决条件是:
- 拥有一个有效的 Google Gemini API 密钥。这是调用 Google Imagen 3.0 服务所必需的凭证。
安装及配置步骤
Imagen3-MCP 通常作为一个独立的可执行文件运行,并通过环境变量进行配置。以下是在两种常见的集成环境 Cherry Studio 和 Cursor 中的安装和配置方法:
安装步骤——Cherry Studio
- 下载可执行文件: 前往项目的 GitHub Releases 页面,下载与你的操作系统对应的最新版本可执行文件。
- 放置文件: 将下载的可执行文件(例如
imagen3-mcp.exe
)放置在系统中的任意位置,例如C:\bin\
目录下。 - 在 Cherry Studio 中配置: 打开 Cherry Studio,找到与模型或工具集成的相关配置项,进行以下设置:
- Command 字段: 填写你刚才放置的可执行文件的完整路径,例如
C:\bin\imagen3-mcp.exe
。 - 环境变量
GEMINI_API_KEY
: 在 Cherry Studio 的环境变量配置中,添加一个名为GEMINI_API_KEY
的环境变量,并将其值设置为你的 Google Gemini API 密钥。 - [可选] 环境变量
BASE_URL
: 如果你需要通过代理访问 Google API(例如解决网络限制问题),可以设置此环境变量,填写代理服务的地址,例如https://lingxi-proxy.hamflx.dev/api/provider/google
。需要注意的是,此设置可能解决防火墙问题,但无法绕过 Google 基于 IP 的访问限制,因此在某些情况下仍需要使用 VPN 或其他方式辅助。 - [可选] 环境变量
SERVER_LISTEN_ADDR
: 设置工具启动后作为服务器监听的 IP 地址。默认为127.0.0.1
,表示只允许本地访问。如果需要在网络中其他设备访问,可以设置为0.0.0.0
(需注意安全风险)。 - [可选] 环境变量
SERVER_PORT
: 设置工具启动后作为服务器监听的端口号,同时这个端口也会用于生成的图片 URL 中。默认为9981
。 - [可选] 环境变量
IMAGE_RESOURCE_SERVER_ADDR
: 设置生成的图片 URL 中使用的服务器地址。默认为127.0.0.1
。当 Imagen3-MCP 运行在容器、虚拟机或远程服务器上时,可能需要将其设置为外部可访问的 IP 地址或域名,以便客户端能够正确访问生成的图片资源。
- Command 字段: 填写你刚才放置的可执行文件的完整路径,例如
安装步骤——Cursor
Cursor IDE 也支持 MCP 协议,可以通过修改其配置文件来集成 Imagen3-MCP。在 Cursor 的配置文件中找到 mcpServers
部分,添加如下配置项:
json
{
"mcpServers": {
"imagen3": {
"command": "C:\\bin\\imagen3-mcp.exe", // 可执行文件路径,请替换为实际路径
"env": {
"GEMINI_API_KEY": "<你的GEMINI_API_KEY>" // 替换为你的 Google Gemini API 密钥
// 以下是可选环境变量,根据需要取消注释并填写
// "BASE_URL": "<代理地址>",
// "SERVER_LISTEN_ADDR": "0.0.0.0", // 示例:监听所有接口
// "SERVER_PORT": "9981",
// "IMAGE_RESOURCE_SERVER_ADDR": "your.domain.com" // 示例:图片URL使用域名
}
}
}
}
请确保将 "C:\\bin\\imagen3-mcp.exe"
替换为你实际的可执行文件路径,并将 "<你的GEMINI_API_KEY>"
替换为你获取的 Gemini API 密钥。可选的环境变量与 Cherry Studio 中的解释相同,根据你的网络环境和部署方式进行配置。
许可证
本项目采用 MIT 许可证。这意味着你可以在遵守许可证条款的前提下自由使用、复制、修改、合并、发布、分发、再许可和/或销售本软件的副本。