列出所有可用模型(图像 + 视频)。
OpenAI 兼容的图像生成接口。支持文生图和图生图(通过 images 或 image_url 参数传入参考图)。
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| prompt | string | 是 | 图像描述,最长 32000 字符 |
| model | string | 否 | 模型 ID,如 gpt-image-2 |
| n | integer | 否 | 只支持 1 |
| size | string | 否 | 如 9:16、16:9 等;默认由模型决定 |
| quality | string | 否 | 1k / 2k / 4k ;仅 gpt-image-2 系列有效 |
| response_format | string | 否 | url(默认) / b64_json / privacy_url |
| aspect_ratio | string | 否 | 兼容参数,默认 16:9 |
| image_url | string | 否 | 参考图 URL(图生图) |
| images | array | 否 | 参考图列表,每项为 URL 或 {image_url:"..."} |
| stream | boolean | 否 | 设为 true 启用 SSE 流式响应 |
OpenAI 兼容的图像编辑(图生图)接口。必须提供参考图片。
支持 application/json 和 multipart/form-data。参数与 /v1/images/generations 一致,但必须通过 images 或 image 字段传入至少一张参考图。
创建视频生成任务。支持 Sora2、Veo31 系列模型。可通过 input_reference 或 image_url 传入参考图。
| 参数 | 类型 | 必填 | 说明 |
|---|---|---|---|
| prompt | string | 是 | 视频描述 |
| model | string | 否 | 模型ID |
| aspect_ratio | string | 否 | 16:9 或 9:16 |
| durationSeconds | integer | 否 | 时长(秒),因模型而异:Sora2 支持 4/8/12s,Veo31 支持 4/6/8s |
| resolution | string | 否 | 720p(默认)或 1080p |
| input_reference | string | 否 | 参考图 URL(图生视频) |
| generate_audio | boolean | 否 | 是否生成音频,默认 true |
| negative_prompt | string | 否 | 负向提示词 |
| stream | boolean | 否 | 设为 true 启用 SSE 流式响应 |
列出所有可用模型(图像 + 视频)。
Gemini 兼容的图像生成。
| 参数 | 类型 | 说明 |
|---|---|---|
| contents | array/object | Gemini 格式的 contents,支持 text 和 inline_data |
| generationConfig.imageConfig.aspectRatio | string | 宽高比,如 16:9 |
| generationConfig.imageConfig.imageSize | string | 分辨率,如 1K、2K、4K |
| response_format | string | url(默认)或 b64_json |
Gemini 兼容的流式图像生成。返回 SSE 事件流,包含 progress 事件和最终的 result 事件。
与 :generateContent 一致。
Gemini 兼容的视频生成。通过 instances[0].prompt 传入提示词,parameters 传视频参数。
查询 Gemini 视频生成的操作结果。
| HTTP 状态码 | 含义 |
|---|---|
| 400 | 请求参数错误(无效模型、缺少 prompt、不支持的宽高比等) |
| 401 | API Key 无效或未提供 |
| 429 | Token 配额耗尽 |
| 451 | 内容审核拦截(触发 content_review_keywords)或上游返回 image_unsafe |
| 500 | 服务器内部错误 |
| 503 | 上游服务临时不可用 / 无可用 Token |