GPT-4 多模态生图功能上线,这是一项重大突破。它能够将文本准确地渲染为图像,通过对文本内容的理解和分析,生成与之对应的视觉图像。这一功能让用户可以用文字描述想要的图像,然后迅速获得直观的视觉呈现。它为创意表达、设计、教育等领域带来了新的可能性,使人们能够更便捷地将想法转化为图像,极大地拓展了交互和创作的方式,推动了多模态交流与应用的发展。
3月26日,OpenAI宣布为其多模态模型GPT-4o推出新功能,该功能支持图片生成。用户现在可以通过简单的提示词或上传图片来生成精确、逼真的图像。GPT-4o的图像生成功能在准确渲染文本、遵循提示以及利用其知识库和聊天上下文方面表现出色。这意味着用户可以上传图像作为视觉灵感,或者转换上传的图像,以创建更符合需求的图像。这些能力极大地简化了图像创建过程,提高了准确性。
此前于2024年5月发布的GPT-4o,作为一个原生多模态模型,不仅支持端到端的语音输入输出,现在还扩展了对图片的端到端输入输出支持。
