Генеративні змага́льні мере́жі (англ.Generative adversarial networks, GANs) — це клас алгоритмів штучного інтелекту, що використовуються в некерованому навчанні, реалізовані системою двох штучних нейронних мереж, які змагаються одна з одною в рамках гри з нульовою сумою. Вони були запроваджені Яном Ґудфелоу в 2014 році.[1]
Ця методика дозволяє створювати фотографії, які для побіжного огляду людиною виглядають як справжні та мають багато реалістичних елементів (хоча в тестах люди можуть відрізнити реальні зображення від згенерованих у багатьох випадках).[2]
Метод
Одна мережа генерує кандидатів (генератор), а інша оцінює їх (дискримінатор).[3][4][5][6] Як правило, генеративна мережа навчається будувати відповідності з латентного простору до певного розподілу даних, тоді як дискримінаційна мережа розрізняє представників справжнього розподілу даних та кандидатів, вироблених генератором. Метою тренувальної мережі є збільшення частоти помилок дискримінаційної мережі (тобто «обдурити» дискримінатор шляхом створення нових синтезованих екземплярів, які повинні походити на представників справжнього розподілу даних).[3][7]
На практиці заздалегідь відомий набір даних використовують як початкові навчальні данні для дискримінатора. Навчання дискримінатора передбачає забезпечення його зразками з набору даних, доки він не досягне певного рівня точності. Зазвичай генератор на початку отримує випадково відбирані дані із заздалегідь визначеного латентного простору[4] (наприклад, за допомогою багатовимірного нормального розподілу. Після цього зразки, синтезовані генератором, оцінюються дискримінатором. Метод зворотного поширення помилки застосовується в обох мережах[5], так що генератор створює кращі зображення, тоді як дискримінатор стає більш кваліфікованим при визначенні синтезованих зображень.[8] Генератор, як правило, є деконволюційною нейронною мережею, а дискримінатор — згортковою нейронною мережею.
Ідея вивести моделі в конкурентному середовищі (модель проти дискримінатора) була запропонована Лі, Гаучі та Гросом в 2013 році.[9]. Їх метод використовується для висновків поведінки. Це називається навчання по Тюрінгу (англ.Turing Learning),[10] оскільки цей параметр схожий на тест Тюрінга. Навчання по Тюрінгу є узагальненням генеративної змагальної мережі.[11] У них можуть розглядатись і моделі, відмінні від нейронних мереж. Крім того, дискримінаторам дозволяється впливати на процеси, з яких отримані набори даних, що робить їх активними учасниками, як у тесті Тюрінга. Ідею змагального навчання можна знайти й у більш ранніх роботах, таких як стаття Шмідхубера (англ.Schmidhuber) 1992 року.[12]
Застосування
ГЗМ використовуються для створення зразків фотореалістичних зображень з метою візуалізації нових дизайнів інтер'єру та промислового дизайну, взуття, сумок, одягу та предметів для сцен у комп'ютерних іграх. Відомо, що ці мережі використовуються Facebook.[13] Нещодавно ГЗМ змоделювали закономірності руху у відео.[14] Вони також використовувались для реконструкції 3D-моделей об'єктів зображень[15] і для покращення зображень в астрономії.[16] У 2017 для суттєвого поліпшення якості фотографій використовувалася удосконалена ГЗМ з автоматичною генерацією текстур. Від системи вимагалось скоріше створення реалістичних текстур ніж піксельна деталізація. Результатом була висока якість зображення при високій роздільній здатності.[17]
↑ абThaler, SL, US Patent 05659666, Device for the autonomous generation of useful information, 08/19/1997.
↑ абThaler, SL, US Patent, 07454388, Device for the autonomous bootstrapping of useful information, 11/18/2008.
↑Thaler, SL, The Creativity Machine Paradigm, Encyclopedia of Creativity, Invention, Innovation, and Entrepreneurship, (ed.) E.G. Carayannis, Springer Science+Business Media, LLC, 2013.
↑Luc, Pauline; Couprie, Camille; Chintala, Soumith; Verbeek, Jakob (25 листопада 2016). Semantic Segmentation using Adversarial Networks. NIPS Workshop on Adversarial Training, Dec , Barcelona, Spain. 2016. arXiv:1611.08408. Bibcode:2016arXiv161108408L.
↑Andrej Karpathy, Pieter Abbeel, Greg Brockman, Peter Chen, Vicki Cheung, Rocky Duan, Ian Goodfellow, Durk Kingma, Jonathan Ho, Rein Houthooft, Tim Salimans, John Schulman, Ilya Sutskever, And Wojciech Zaremba, Generative Models, OpenAI, архів оригіналу за 22 квітня 2021, процитовано 7 квітня 2016
↑Gross, Roderich; Gu, Yue; Li, Wei; Gauci, Melvin (6 грудня 2017). Generalizing GANs: A Turing Perspective. Proceedings of the Thirty-first Annual Conference on Neural Information Processing Systems (NIPS 2017). Long Beach, CA, USA. с. 1—11. Архів оригіналу за 30 червня 2018. Процитовано 30 червня 2018.
↑Schawinski, Kevin; Zhang, Ce; Zhang, Hantian; Fowler, Lucas; Santhanam, Gokula Krishnan (1 лютого 2017). Generative Adversarial Networks recover features in astrophysical images of galaxies beyond the deconvolution limit. Monthly Notices of the Royal Astronomical Society: Letters: slx008. arXiv:1702.00403. doi:10.1093/mnrasl/slx008.{{cite journal}}: Обслуговування CS1: Сторінки із непозначеним DOI з безкоштовним доступом (посилання)