2024-08-23 22:09

一个默默无闻的文生图模型,直接给midjourney秒了?-九游会登录

本文来自微信公众号:,作者:丸丸柚贝,原文标题:《一个默默无闻的文生图模型,直接给 dall·e、midjourney 和 flux 秒了?|ai横评》,题图来自:ai生成

文章摘要
ideogram 2.0在多项指标上优于flux、dall·e3和midjourney。

• 🌟 ideogram 2.0在准确性、清晰度和逼真度上表现突出。

• 🚗 专业摄影、广告创意和海报宣传生成效果一流。

• 📊 ideogram和flux评分最高,dall·e3和midjourney稍逊。

前两天ideogram更新了2.0版本,并且现在可以免费体验。


网友:什么?干嘛的?


一年前发布的ideogram确实在ai生图领域没什么太大水花,甚至很多人都不知道它。


但ideogram在更新2.0版本后直接点名挑战前几天爆火的flux和dall·e3以及众多文生图模型。


ideogram官方声称,2.0版本要比flux和dall·e3要强,并且在生成逼真图像、图形设计、排版等方面具有行业领先的功能。还在许多质量指标上都显着优于其他文生图模型,包括图像文本对齐、总体主观偏好和文本渲染准确性。



优于其他模型?口说无凭,我们先来测测实力,让ideogram和最近爆火的flux以及dall·e3、midjourney一起接受我们的考验。


我们按照以下统一标准进行测评,每个标准设置1分,每题5分共4题,总分20分。


(ps:prompt统一使用英文投喂,仅在文中翻译为中文。)


评价标准:


准确性:生成的图像是否准确地反映了文本描述的内容和细节。


清晰度:图像的分辨率和细节清晰度,是否能够清晰地看到图像中的元素。


逼真度:图像的逼真程度,包括颜色、纹理、光影效果等是否接近现实世界。


创造性:ai在生成图像时展现的创造性,是否能够根据文本描述创造出新颖和有趣的图像。


多样性:ai在生成图像时是否能够提供多种风格或视角的图像,以适应不同的需求。


写实风格


prompt:小丑在专业摄影环境中优雅行走的特写镜头。他沐浴在霓虹红、蓝色和紫色的灯光中。


ideogram


flux


dall·e3


midjourney


ideogram、flux、dall·e3和midjourney四家对小丑的理解一致性还挺高的,基本都还原了杰昆·菲尼克斯饰演的亚瑟·弗莱克的形象,并且基本还原了提示词中的内容。


ideogram和flux在整体的画质和人物的真实感和一些细节(比如衣服褶皱,光影明暗对比)方面表现比较好;dall·e3生成的效果有点生硬,不够自然真实;midjourney生成效果风氛围强,但光影对比效果不明显。


ideogram:flux:dall·e3:midjourney 5:5:3:4


广告创意设计


prompt:一辆豪华跑车停在光线昏暗的高端车库中,光束突出跑车的曲线和光泽饰面。汽车的前灯发出强烈的光芒。顶部用粗体字写着“unleash the beast”。标语“engineered for excellence”位于下方。

ideogram


flux


dall·e3


midjourney


ideogram对于提示词中的文字生成最准确,画面的真实感表现得最好,光影反射也符合物理规律,图片的质感和设计感表现突出;其次是flux,环境背景真实,但汽车的线条有点不自然,文字生成有一点错误;midjourney生成的汽车背景和光影还算自然,但文字生成与提示词有明显出入,最后dall·e3,背景真实感强,但是主体汽车生成不自然,文字生成有些模糊。


ideogram:flux:dall·e3:midjourney 5:4:2:3


漫画海报设计


prompt:为《这个杀手不太冷》设计一张宣传海报,以现代城市为背景,雾霾的夜晚。马路中间一名大叔身穿黑色风衣的,神色凝重,手捧盆栽,目光深邃。一个穿着红色外套,拿着手枪的小女孩,眼神坚定,神色固执。背景中隐约可见城市的高楼大厦和霓虹灯,营造出一种紧张不安的气氛。海报下方用粗体写下电影片名“leon:the professional”,并在底部附上标语:"cold appearance,warm heart,a wonderful killing journey!"


ideogram


flux


dall·e3


midjourney


整体来说还是ideogram和flux表现较好,但ideogram文字生成漏掉了一个字母,flux的大叔形象不太符合漫画风格;dall·e3的海报设计感强,但文字生成错乱严重;midjourney与最贴合原著,但是背景生成与提示词不符,而且文字生成不准确。


ideogram:flux:dall·e3:midjourney 4:4:2:4


3d风格


prompt:主题是《黑神话:悟空》中的悟空,他身穿华丽的铠甲,上面饰有金色的龙鳞,肩甲和护腕上都饰有古老的符文。他手持一根金箍棒,散发出强烈的光芒。他的头发如火焰般飘扬,面部表情坚毅而威严。背景是充满神秘色彩的古老战场,断断续续的山脉和神秘的光影环绕,呈现出史诗般的氛围。整体风格将中国传统元素与现代3d渲染技术相结合。


ideogram


flux


dall·e3


midjourney


虽然他们生成的都不像悟空,但整体看来dall·e3的表现较好,审美在线,背景最符合中国传统风格,只是人物的武器不是金箍棒;ideogram的生成效果更偏向于q版可爱风格,立体感强,整体画面比较符合提示词;flux生成的质感不错,但右手有点变形;midjourney的审美也很在线,人物贴合提示词。


ideogram:flux:dall·e3:midjourney 3:4:4:4


总结


最终得出总比分为:


ideogram:flux:dall·e3:midjourney 17:17:11:15


ideogram和flux的生图效果相差无几,但都明显比dall·e3和midjourney的效果好,尤其是在文字生成方面。但它们的中文生成能力还是有待提高。


总的来说,我也是没想到ideogram的能力还挺强的,不管是专业摄影、广告创意还是海报宣传,整体表现的一副完全可以商业化落地的样子,逼得midjourney都限时免费了。


体验链接:https://ideogram.ai/t/explore/design

本内容为作者独立观点,不代表虎嗅立场。未经允许不得转载,授权事宜请联系hezuo@huxiu.com
如对本稿件有异议或投诉,请联系tougao@huxiu.com
正在改变与想要改变世界的人,都在
赞赏
关闭赞赏 开启赞赏

支持一下   修改

确定
热门标签
网站地图