Автор:
Ethan Mollick
Оригинальное название:
Co-Intelligence. Living and Working With AI
Знакомьтесь: ваш второй интеллект
Эта книга была опубликована в апреле 2024 года, а уже в мае компания Open AI представила GPT-4o – модель ИИ, которая превосходит по мощности и гибкости все существовавшие ранее. И это значит, что книга Итана Моллика стала еще полезнее. Моллик много лет занимается исследованием влияния инноваций на бизнес, работает со студентами, а в последнее время активно применяет инструменты ИИ в работе и жизни. Промпты[1] Моллика расходятся по всему миру как образцы эффективного общения с ИИ. Он настоящий энтузиаст новой технологии, который – и это важно – умеет и хочет делиться своими знаниями.
В своей новой книге Моллик объясняет принципы, на которых строится работа искусственного интеллекта. Прочитав саммари, вы сможете поладить с любой новой моделью ИИ и получите его поддержку во множестве повседневных и рабочих дел. ИИ будет помогать вам писать, анализировать, планировать, генерировать идеи и изображения, переводить и искать вдохновение – словом, станет вашим дополнительным мозгом.
Итан Моллик также рассказывает о том, как ИИ меняет нашу реальность, какие этические и правовые вопросы возникают перед человечеством в связи с развитием ИИ, как человеку найти свое место в мире, где все большее влияние будет получать стремительно развивающиеся технологии. Горячий бестселлер The NewYork Times и Amazon – и, конечно же, книга, которую должен прочесть сегодня каждый человек.
Принципиально другая революция
Пока технологические компании отчаянно конкурируют за передовые позиции в разработке инструментов ИИ, многие «обычные люди» стараются не замечать новшеств в надежде, что перемены не слишком сильно повлияют на их жизнь. Однако изменения в обществе в связи с развитием ИИ будут настолько всеобъемлющими, что избежать их воздействия не удастся никому. Мы живем в эпоху новой технологической революции, сравнимой с изобретением колеса, паровых машин, двигателя внутреннего сгорания или распространением интернета.
Изобретение ИИ – технологическая революция, которая уже сегодня меняет все аспекты жизни – от здравоохранения и транспорта до образования и производства. Она обещает повысить эффективность множества процессов, улучшить качество жизни и создать такие возможности для людей и бизнеса, о которых мы недавно даже не мечтали. Но одновременно она поднимает очень важные и отчасти болезненные вопросы о конфиденциальности, безопасности, неравенстве.
Эта революция имеет принципиальное отличие от всех прежних технологических прорывов: впервые в истории изобретение расширяет не физические, а интеллектуальные возможности человека.
Мы получили в свое распоряжение дополнительный интеллект. Еще в 1970-х футуролог Рой Амара сформулировал ключевой закон в области прогнозирования технологического развития: «Мы склонны переоценивать эффект технологии в краткосрочной перспективе и недооценивать в долгосрочной». Давайте же обсудим оба эти ракурса и попробуем понять, как устроен и на что способен ИИ, как он изменит наш мир и что делать, чтобы преуспеть в новой реальности.
Первые опыты по созданию инструментов искусственного интеллекта начались еще в 1950-х годах. Но долгое время ИИ оставался «игрушкой технарей», которая обещала гораздо больше, чем реально могла сделать. С распространением интернета и Big Data[2] ИИ вошел в нашу жизнь в виде улучшенных алгоритмов поиска, навигации, интернет-торговли и т. д. – но все эти изменения были связаны со статистической обработкой и прогнозированием на основе понятных, четко ограниченных алгоритмов.
Перелом наступил в ноябре 2022 года, когда появился Chat GPT- 3.5. Всего в течение месяца с момента появления Chat GPT- 3.5 успешно прошел как тест Тьюринга (пользователь не может определить, кто с ним общается – ИИ или человек), так и тест Лавлейс (пользователь не может определить, кто решил творческую задачу – ИИ или человек).
В отличие от предыдущих технологических революций, результаты которых распространялись довольно медленно, новое изобретение охватило планету в считаные недели. И чтобы начать использовать все преимущества ИИ, человечеству не понадобятся десятилетия, как это было с паровыми машинами, двигателем внутреннего сгорания, конвейерами и даже интернетом. Физическая база для успеха этой технологии уже есть в руке у каждого жителя развитых стран – это обычный смартфон. Кроме того, эта модель ИИ общается с человеком на его естественном языке. В невероятно короткие сроки новый ИИ стал самым быстро распространяющимся технологическим решением в истории человечества.
Бесплатный Chat GPT-3.5 всего за три месяца существования набрал свыше 100 млн пользователей.
По оценкам исследователей, паровые двигатели подняли эффективность производственных процессов на 18–22 %. Потенциальный эффект от внедрения инструментов ИИ составляет 20–80 % в различных областях человеческой деятельности.
Конечно, это вызывает растерянность у многих людей. Приведет ли новая технологическая революция к тому, что человек во многих сферах станет ненужным? Кто потеряет работу? Кто преуспеет в новой реальности? Чему и как мы должны учиться теперь?
Современные модели ИИ называют большими языковыми моделями (LLM, Large Language Models). В основе их работы лежит принцип трансформера, разработанный специалистами Google в 2017 году: ИИ присваивает словам и выражениям разный вес и сосредоточивается на наиболее значимых частях текста, чтобы облегчить понимание и создать более человечный ответ на запрос.
С технической точки зрения ChatGPT действует как очень сложный автозаполнитель, как в поисковике: ему дают начальный текст, который он продолжает на основе вероятностного анализа.
ИИ непрерывно обучается на огромном количестве текстов, оценивая их значимость и анализируя взаимосвязи между словами и их частями.
В версии ChatGPT конца 2023 года содержалось 175 млрд кодов, описывающих взаимные связи слов и частей слов. Важно, что эти коды не были заданы в ИИ изначально, он сгенерировал их сам в процессе работы.
Модели ИИ для обработки изображений обучаются на картинках, сопровождаемых соответствующими текстовыми подписями. Сопоставляя изображение с его описанием, модель учится ассоциировать слова с визуальными концепциями.
Модели ИИ, которые работают с текстами и с изображениями, называют мультимодальными.
Поначалу картинка может быть очень странной или искаженной – но за несколько итераций модель постепенно добивается большой реалистичности изображения. Чем глубже обучается модель, тем успешнее она превращает текстовые запросы в релевантные картинки.
Необходимость масштабного обучения делает производство ИИ очень дорогим и доступным ограниченному числу компаний.
Потребность в огромных объемах данных для обучения также обостряет вопросы авторского права и защиты информации. Как быть, если ИИ точно воспроизводит уникальный стиль художника или автора текстов? Что делать, если ИИ получил в свое распоряжение конфиденциальную информацию? Ответов на большинство этих вопросов у человечества пока нет.
Из всех стран мира пока только Япония уже приняла закон о том, что ИИ имеет право обучаться на любых данных, которые стали ему доступны.
Возникают также вопросы к этическим границам действий ИИ. ИИ безразлично, предлагать пользователю рецепт яичницы с беконом или рецепт взрывчатки, милую картинку или изображение сцен жесткого насилия. Но для человека эта разница огромна.
Чтобы скорректировать ответы ИИ с точки зрения этики и параллельно улучшить их релевантность запросам, модели ИИ проходят и вторую фазу обучения – так называемую тонкую настройку, в которой участвуют живые люди