Интеллект – это страсть.
Рене Декарт
Революцию генеративного ИИ отсчитывают с ноября 2022 года. О ее исторических и технологических предпосылках мы рассказали в предыдущих сюжетах. Для понимания нужно также обратиться к организационным аспектам, которые лежали в основе нового прорыва.
В 2015 году группа технологических энтузиастов-визионеров создала некоммерческую организацию OpenAI – исследовательскую лабораторию в области ИИ. Среди основателей были Сэм Альтман, Илон Маск, Илья Суцкевер – важные фигуры современной ИИ-отрасли. Цели новая организация провозгласила самые благие. Продвижение технологий ИИ во всем мире и бескорыстная помощь человеческой цивилизации – примерно в таких формулировках.
Основателей OpenAI чрезвычайно заботило, что будущий сильный ИИ может оказаться в частной собственности крупной корпорации. Сэм Альтман, вовлекая Илона Маска в новый проект, убеждал его, что Google вот-вот совершит технологический прорыв и захватит весь мир. Вот что он писал тогда культовому миллиардеру:
Я много размышлял и думаю, что человечество невозможно остановить от разработки ИИ. Так что, если это всё равно произойдет, то было бы неплохо, чтобы кто-то другой, а не Google, сделал это первым.
Как думаешь, было бы хорошей идеей запустить что-то вроде «Манхэттенского проекта» для ИИ? Мне кажется, мы могли бы привлечь немало топовых специалистов в индустрии. Можно было бы структурировать проект так, чтобы технология принадлежала всему миру…
Такие экзистенциональные цели были близки Маску. Свои главные бизнес-проекты – электрические автомобили и многоразовые космические полеты – он также запускал под цивилизационными лозунгами.
К тому моменту Маск разошелся во мнениях о перспективах ИИ со своим другом Ларри Пейджем – одним из основателей Google. Пейдж считал, что нужна конкуренция между человеком и ИИ, в которой должен победить сильнейший. Илону Маску идея, что человечество проиграет эволюционную гонку своему творению, категорически не нравилась. Как не нравились и монополистские намерения корпорации Google, которая к тому моменту приобрела компанию DeepMind, технологического ИИ-лидера того времени.
Илон Макс согласился с идеей Альтмана и вошел в некоммерческий проект в качестве инвестора, внеся на первых порах 45 миллионов долларов.
В самом начале лаборатория OpenAI заявила, что будет публиковать свои наработки в открытом доступе. И на первых порах честно это делала. Но уже в 2016 году подход стал меняться. Вот как его выразил Илья Суцкевер в одном из писем своим соратникам:
По мере того, как мы приближаемся к созданию ИИ, имеет смысл начинать быть менее открытыми. «Open» в OpenAI означает, что все должны пользоваться плодами ИИ после его создания, но совершенно нормально не делиться результатами исследований…
Тогда же выяснилось еще одно печальное, на закономерное обстоятельство. Как говорил один великий человек, логика обстоятельств сильнее логики намерений. Быстро стало понятно, что новые технологические решения по работе с нейросетями требуют серьезных вычислительных ресурсов. Да и зарплату элитным разработчикам нужно платить, какими бы энтузиастами научного прогресса они не были.
45 миллионов быстро закончились и нужны были новые инвестиции. Альтман считал, что нужно 100 миллионов долларов. Более опытный бизнесмен Илон Маск утверждал, что нужно собрать как минимум один миллиард. Почему Илон Маск сам не вложил всю сумму, широкой общественности не известно. Не решился, не было свободных средств, не хотел монополии – сейчас это не так важно.
К 2017 году стали понятны две вещи.
Первая – денег нужно еще больше, чтобы на равных конкурировать с Google. Для обеспечения вычислений нужны были современные GPU (графические платы). У Google на тот момент их было около 100 000, у OpenAI – только 6 000.
Вторая – привлечь инвесторов в некоммерческий проект не получится. Вкладывать миллиарды без отдачи, на благо всего человечества? Это не к частным инвесторам, а к государству. Власти США на роль такого общечеловеческого благодетеля тоже не подходили (впрочем, как власти любой страны).
Некоммерческая организация OpenAI после нескольких лет попыток создает в 2019 году коммерческую дочернюю структуру с одноименным названием. Она должна была принимать инвестиции, расходовать их (на благие цели, естественно) и обеспечивать будущую прибыль инвесторов.
Предсказать дальнейшее несложно. Быть единоличным лидером некоммерческой организации – это не очень интересное занятие. Поэтому основатели вполне уживались и дружно работали на благое начинание. А вот стать CEO бизнеса, в перспективе способного диктовать условия всему миру, – это совсем другое.
Илон Маск, как главный и на тот момент практически единственный инвестор некоммерческой организации OpenAI, по праву считал это кресло своим. Остальные основатели с этим не согласились. В переписке это звучало примерно так:
Ты раньше говорил, что не стремишься за контролем над будущим AGI, а тут вдруг выяснилось, что тебе критично стать CEO компании и получить абсолютный контроль над ней.
Маск, не получив желаемого, хлопнул дверью, прекратил финансирование и вышел из проекта. В 2024 году он подал в Калифорнийский суд иск к OpenAI, обвинив ее в отходе от заявленных изначально целей и ценностей. Иск суд, кстати, отклонил, но это другая история.
В 2019 году OpenAI привлекает инвестиции, но их не хватает.
В 2020 году экспертному сообществу представляется ChatGPT 3.0, работающий с множеством недостатков, но уже весьма перспективный продукт. И в этот момент на сцене появляется компания Microsoft, руководство которой понимает, что новые технологии ИИ – стратегическая угроза бизнесу корпорации. Microsoft делает OpenAI предложение, от которого трудно отказаться.
На первом этапе Microsoft инвестирует 1 миллиард долларов, получает долю в компании OpenAI и доступ к ее технологиям. Затем в несколько этапов заключаются новые соглашения и инвестиции увеличиваются на порядок. В октябре 2025 года Microsoft получает 27% в компании OpenAI. Эта доля оценивается в 135 миллиардов долларов. Кроме этого, по соглашению Microsoft сохраняет доступ к технологиям OpenAI до 2032 года.
В 2020 году команда Сэма Альтмана получает необходимые ресурсы, позволяющие форсировать разработки и наращивать возможности своих больших языковых моделей. В конце 2020 года из компании увольняется большая группа сотрудников, что тормозит, но не останавливает исследования. В 2021 году выходцы из OpenAI создают компанию Anthropic, еще одного современного лидера ИИ-отрасли. Не останавливается работа в тиши исследовательских лабораторий корпорации Google.
Гонка за первородство прорывается в публичное пространство в ноябре 2022 года. Компания OpenAI выпускает в виде веб-сервиса ChatGPT 3.5. Чат-бот практически мгновенно становится самой популярной темой обсуждений в экспертном сообществе и на кухнях. По некоторым оценкам ChatGPT 3.5 стал самым быстрорастущим веб-сервисом в истории интернета, достигнув 100 миллионов пользователей всего через два месяца после запуска.
Наверняка ChatGPT 3.5 имел много нереализованных возможностей. Это подтверждается быстрым выходом на рынок новых версий популярного чат-бота – ChatGPT 4o, ChatGPT 4o mini, ChatGPT 4.5, ChatGPT 5.0. Но компания приняла стратегически верное решение – вывести продукт на рынок «как есть», не дожидаясь идеального функционала. И не прогадала. Во-первых, как бы не сложилась дальше гонка ИИ-лидеров, первенство в революции генеративного ИИ остается за OpenAI. Во-вторых, конкуренты сразу были поставлены в позицию догоняющих.
Выход в свет ChatGPT 3.5 можно ассоциировать и с ящиком Пандоры, и с прорывом плотины, и с запуском первого спутника. Революция началась, и ее уже не остановить. Интересна в этой связи реакция миллиардера-мечтателя Илона Маска. Сначала он пытался собрать экспертов и сформировать общественное мнение в пользу ограничений ИИ-технологий, несущих человечеству невероятные угрозы. Затем, в марте 2023 года создал свою ИИ-компанию, которая со своим продуктом Grok быстро присоединилась к лидерам.
С 2023 года на ошалевшее человечество, которое только успокоилось после эпидемии COVID-19, как из рога изобилия посыпались ИИ-решения, выдаваемые на-гора лидерами и многочисленными стартапами. Все, имевшие собственные наработки в области ИИ, стремились присоединиться к революции, получить свою долю хайпа и инвестиций. Инвесторы не просто оживились. Они пришли в полный восторг и на все, что связано с генеративным ИИ, полился дождь инвестиций.
Оптимисты утверждали, что новый чат-бот успешно проходит тест Тьюринга. Конечно, можно придираться и утверждать, что это не совсем так. ChatGPT 3.5 и даже его более продвинутые потомки некоторое время не могли, например, правильно посчитать, сколько букв R в слове STRAWBERRY. Только чат-бот ChatGPT 5.0 научился справляться этой фундаментальной задачей.
Но если смотреть на подавляющее число диалогов, которые увлеченные пользователи вели и ведут с чат-ботами, то отличить их от диалогов людей друг с другом практически невозможно.
Но текстовые диалоги генеративных нейросетей – это лишь верхушка айсберга. Или, точнее, – фундамент, на котором строится все величественное строение под названием «генеративный ИИ». Практически все иные инструменты предполагают текстовый диалог с пользователями. Генераторам изображений, аудио и видео нужно пояснять, что должно получится на выходе. Писать prompt – так это сейчас называется. Генеративный ИИ должен prompt прочитать, разобрать и понять.
В завершении сюжета кратко перечислим, что сегодня может делать генеративный ИИ. И наш список – далеко не полный, области применения и решаемые задачи постоянно множатся.
Генеративный ИИ:
пишет самые разнообразные тексты: стихи, рассказы, рекламные сообщения, официальные письма, …;
создает новые изображения по заданным описаниям и в заданных стилях, реставрирует фотографии, обрабатывает изображения (например, удаляет лишние детали или добавляет новые);
пишет музыку, тексты к ней и песни, неотличимо подделывает голоса любых людей, общается с клиентами в службах поддержки;
генерирует по заданному сценарию и на основе предлагаемых изображений реалистичное видео, накладывают на видеоряд звуковое сопровождение;
разрабатывает сценарии (фильмов, шоу-программ), составляет планы мероприятий и аналитические отчеты, учебные курсы и тесты, делает презентации – и все это с уместным сочетанием информации в разных форматах;
пишет программный код на всех языках программирования для решения все более сложных задач, тестирует программный код и находит в нем ошибки;
выполняет домашние задания для школьников и студентов, готовит курсовые работы и дипломные проекты;
проверяет тексты договоров, в том числе на соответствие законодательной базе, находит в них ошибки и противоречия;
анализирует результаты медицинских анализов и исследований, ставит диагнозы, выявляет патологии, отслеживают состояние пациентов и консультирует их, помогает разрабатывать лекарства.
Перечень не полный, но и его достаточно, чтобы признать: генеративный ИИ прорвал плотину, открыл ящик Пандоры, и шестая информационная революция началась. ИИ-разработчики соревнуются, расширяя возможности своих творений и создавая все новые и новые решения. Инициативные пользователи с помощью генеративного ИИ улучшают свои профессиональные возможности. Любознательные пользователи балуются с новой игрушкой. Обычные пользователи присматриваются и готовятся вступить в гонку века. Скептики сомневаются, алармисты бьют в колокола. Караван идет, набирая ход.
Резюме. Инициатива, которая начиналась как желание ИИ-визионеров послужить человечеству, быстро превратилась в крупнейший в истории инвестиционный бум. К чему это в итоге приведет? Ответ на этот сакраментальный вопрос будем искать в последующих сюжетах.
