Як користуватися ChatGPT Images 2.0? Практичний тест меню з яловичим раменом, обкладинок журналів, ефекту багатомовної популяризації

robot
Генерація анотацій у процесі

OpenAI випустила інструмент для створення зображень ChatGPT Images 2.0, який відзначається потужними можливостями складного форматування та обробки багатомовного тексту (включаючи китайську), у цій статті буде детально представлено функції, особливості, безкоштовні та платні плани, а також результати тестового генерування.

Що таке ChatGPT Images 2.0? Основні функції та особливості!

З’явився інструмент для створення AI-зображень, здатний конкурувати з Gemini Nano Banana 2? OpenAI оголосила про запуск ChatGPT Images 2.0, який працює на новій моделі GPT Image 2, орієнтованій на високоякісне зображення з можливістю вибору, розташування та викриття інформації. Нижче наведено три головні особливості ChatGPT Images 2.0:

Потужне форматування та обробка багатомовного тексту

Першою очевидною особливістю є значне покращення можливостей форматування та обробки багатомовного тексту у ChatGPT Images 2.0.

Згідно з іноземним виданням Techcrunch, раніше інструменти для генерації зображень на основі AI здебільшого використовували дифузійні моделі, які часто стикалися з труднощами при написанні тексту. ChatGPT Images 2.0 здатен точно відтворювати дрібний текст, іконки та елементи інтерфейсу користувача.

OpenAI заявила, що Images 2.0 демонструє значний прогрес у роботі з нелатинськими мовами, включаючи китайську, японську, корейську, хінді та бенгальську, які можуть бути згенеровані з високою чіткістю у зображеннях.

Джерело: офіційний приклад генерації ChatGPT Images 2.0 від OpenAI

Нові можливості мислення та пошук у мережі

Крім можливостей форматування та обробки багатомовного тексту, ChatGPT Images 2.0 пропонує нові функції мислення, зокрема, можливість здійснювати пошук у мережі для допомоги у створенні зображень. Модель оновлена до знань станом на грудень 2025 року, що допомагає генерувати контент, пов’язаний із недавніми подіями.

Джерело: офіційний приклад генерації ChatGPT Images 2.0 від OpenAI

Підтримка 2K роздільної здатності та різноманітних співвідношень сторін

ChatGPT Images 2.0 підтримує створення зображень з роздільною здатністю до 2K та пропонує широкий вибір співвідношень сторін, від широкоформатних 3:1 до довгоформатних 1:3.

Керівник досліджень OpenAI Бойуань Чен (Boyuan Chen) зазначив, що архітектура Images 2.0 була повністю оновлена і є універсальною моделлю, яка за допомогою простих текстових підказок може виконувати перетворення у 3D-стилі та складне просторове логіку.

Функції безкоштовних та платних планів ChatGPT Images 2.0

Чи вартує платити? Різні рівні платних користувачів ChatGPT Images 2.0 мають доступ до різних функцій, що наведено нижче:

  • Безкоштовні користувачі: наразі можуть використовувати базову модель ImageGen 2.0 для стандартних завдань створення зображень. Базова версія вже включає багато ключових оновлень, таких як кращий слідування інструкціям, потужніше відтворення тексту, багатомовна підтримка та різноманітні співвідношення сторін.
  • Користувачі ChatGPT Plus, Business та Enterprise: ці платні користувачі можуть активувати нову модель мислення. У цьому режимі генератор зображень у чат-боті використовує пошук у мережі, створює візуальні пояснення на основі завантажених файлів і перед створенням зображення виконує структурне логіку. Одночасно можна генерувати до 8 зображень, зберігаючи послідовність персонажів, об’єктів і стилів.
  • Користувачі Pro: отримують доступ до більш просунутої моделі ImageGen Pro. Хоча OpenAI ще не оприлюднила точні деталі різниці між Pro та функцією мислення, корпоративні користувачі можуть вважати цю функцію суттєвим оновленням, корисним для створення фактологічних пояснень, перетворення внутрішніх документів у ілюстрації або збереження візуальної послідовності у кількох активів.
  • Розробники API: тепер можуть інтегрувати модель gpt-image-2 з підтримкою високої роздільної здатності та гнучких налаштувань співвідношення сторін.

Тестування ChatGPT Images 2.0: меню, журнали, ілюстрації та графіки

Як показує практика, чи відповідає реальність рекламним заявам OpenAI? Проведемо тестування.

Тест меню ресторану з м’ясною локшиною

Редактор «Крипто Місто» протестував безкоштовний план ChatGPT, створивши меню тайванської м’ясної локшини за допомогою простих підказок: «Згенеруй меню з тайванською м’ясною локшиною, використовуючи традиційний китайський шрифт, з назвою страв, цінами та зображеннями.»

Результат:

Джерело: генерація ChatGPT Images 2.0

З точки зору можливостей безкоштовної версії, результат цілком прийнятний, хоча при детальному розгляді видно, що при обробці складних каліграфічних китайських символів у зображеннях все ще трапляються помилки у написанні. Можливо, платна версія дасть кращий результат.

Крім того, ціна відповідає приблизно ціновій політиці локальної тайванської м’ясної локшини, і можна безкоштовно додати один повторний порційний об’єм.

Якщо ж потрібно друкувати меню, найкращим варіантом є перетворення згенерованих зображень у векторний формат (наприклад, EPS, .ai у Adobe Illustrator або PDF) та використання кольору CMYK. Це забезпечить найкращу якість друку. Хоча друкарні можуть приймати JPG або PNG, для високоякісного друку краще використовувати векторні формати.

Тест обкладинки наукового журналу

Наступним тестом стала обкладинка наукового журналу з фантастичним дизайном. Підказка: «Згенеруй обкладинку технологічного журналу з традиційним китайським шрифтом, назва журналу “Крипто Місто”, тема “Перехрестя блокчейну та AI”, з заголовком, номером випуску, штрихкодом і датою закінчення, усі елементи мають бути чіткими та професійно вирівняними.»

Результат:

Джерело: генерація ChatGPT Images 2.0

Цей результат схожий на попередній — з першим погляд здається непоганим, але при детальному розгляді видно, що при обробці складних каліграфічних китайських символів все ще трапляються помилки. Шрифт на обкладинці нагадує шрифт “JinSuan” від тайванської компанії Justfont, можливо, з ліцензією.

Такі питання виникали й у «Крипто Місто» під час запуску Nano Banana Pro.

  • **Стаття:**Nano Banana Pro тестування: китайські символи покращилися! Але з’явилися сумніви щодо авторських прав на анімацію та шрифти

Тест багатомовних ілюстраційних графіків

«Крипто Місто» протестувало графік причин землетрусу з текстом українською, японською та корейською мовами. Складний багатомовний текст був частково успішно відтворений. У форматуванні враховувалися різні кольори для різних мов, хоча при детальному розгляді деякі складні каліграфічні символи все ще були розмитими.

Результат:

Джерело: генерація ChatGPT Images 2.0

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити