- Категорія
- Техно
- Дата публікації
- Змінити мову
- Читать на русском
AI4Future: Головні ШІ-новини тижня (16-22 грудня)
Цей тиждень відзначився цікавими та дещо детективними трендами. По-перше, машини (алгоритми), створені за подобою людей, отримують певні позитивні та негативні характеристики і вади людей. Так, наприклад, виявлено, що ШІ може точніше, ніж людські експерти, відрізнити шотландський віскі від американського бурбона та визначити основні аромати, використовуючи дані, а не дегустацію напоїв. А інше дослідження виявило, що у чат-ботів з часом відбувається когнітивна деградація і з’являються ознаки деменції, як у людей.
По-друге, ціла детективна історія викрилась щодо OpenAI. Колишнього дослідника OpenAI, який став викривачем неетичності компанії, було знайдено мертвим у квартирі в Сан-Франциско, повідомили власті. В той самий час компанія продовжує свій марафон новинок і анонсувала виплати колишнім і нинішнім співробітникам в рамках приватного продажу акцій, організованого японською компанією SoftBank Group.
По-третє, треба відзначити ряд знакових наукових проривів і висновків. Так, співзасновник OpenAI Ілля Суцкевер заявив, що підхід до створення ШІ зміниться: "Ми досягли піка даних, і нових більше не буде", — сказав він. Meta AI анонсувала свій винахід - Byte Latent Transformer (BLT), який є архітектурою без токенізатора, яка обробляє "сирі" байтові послідовності й динамічно групує їх у патчі залежно від складності даних. Цей підхід забезпечує ефективне масштабування, досягаючи або перевершуючи продуктивність моделей на основі токенізації (вся поточна ШІ-екосистема побудована на підході токенізації даних). І, нарешті, Nvidia заявила, що "нейронний рендеринг" може стати новою ШІ-магією в графічних процесорах наступного покоління Nvidia RTX 50-серії. Іншими словами, ігри більше не будуть рендеритись за допомогою традиційного 3D-пайплайна, а повністю створюватимуться нейронними мережами.
Огляд новин за цей тиждень
Співзасновник OpenAI та колишній головний науковий співробітник Ілля Суцкевер привернув увагу ЗМІ на початку цього року після того, як покинув компанію, щоб заснувати власну лабораторію штучного інтелекту Safe Superintelligence Inc. Після відходу він уникав публічності, але в п’ятницю зробив рідкісний виступ у Ванкувері на конференції з нейронної інформаційної обробки систем (NeurIPS). «Попереднє навчання, яке ми знаємо, безсумнівно завершиться», – сказав Суцкевер. Це стосується першого етапу розробки моделей ШІ, коли великі мовні моделі вивчають закономірності, використовуючи величезні обсяги немаркованих даних — зазвичай текстів з інтернету, книг та інших джерел. «Ми досягли піку даних, і нових більше не буде». Під час виступу на NeurIPS Суцкевер зазначив, що хоча наявні дані все ще можуть просунути розвиток ШІ, індустрія наближається до вичерпання нових даних для навчання. Це, за його словами, змусить розробників змінити підхід до навчання моделей. «Ми повинні працювати з даними, які в нас є. Інтернет лише один».
Викривача неетичності діяльності OpenAI знайдено мертвим у квартирі в Сан-Франциско
Колишнього дослідника OpenAI, який став викривачем неетичності компанії, було знайдено мертвим у квартирі в Сан-Франциско, повідомили власті.
Тіло 26-річного Сучіра Баладжі виявили 26 листопада після того, як поліція отримала дзвінок із проханням перевірити його самопочуття. Офіс судмедексперта Сан-Франциско визначив, що причина смерті – самогубство, а поліція не виявила ознак насильницьких дій. Останніми місяцями Баладжі публічно критикував практики компанії OpenAI, яка зіткнулася з низкою судових позовів щодо збору даних. У жовтні газета New York Times опублікувала інтерв’ю з Баладжі, в якому він стверджував, що OpenAI порушувала закони про авторське право США під час розробки свого популярного чат-бота ChatGPT.
Microsoft AI представляє Phi-4: нову компактну мовну модель на 14 мільярдів параметрів, спеціалізовану на складних міркуваннях
Великі мовні моделі досягли значних успіхів у розумінні природної мови, вирішенні програмістських завдань та розв’язанні логічних задач. Однак їхні висока вартість обчислень і залежність від масштабних наборів даних створюють низку проблем. Багато таких наборів даних не мають необхідної різноманітності та глибини для складних міркувань, а такі питання, як забруднення даних, можуть знижувати точність оцінювання. Щоб вирішити ці виклики, Microsoft Research розробила Phi-4 — мовну модель на 14 мільярдів параметрів, яка вирізняється ефективністю у завданнях міркування при оптимізованому використанні ресурсів.
Meta AI представляє Byte Latent Transformer (BLT): модель без токенізатора, що ефективно масштабується
Традиційно навчання на послідовностях байтів вимагало великих обчислювальних витрат через довгі послідовності, необхідні для цього процесу. Навіть із вдосконаленнями у механізмах самоуваги токенізація залишається вузьким місцем, що знижує стійкість і адаптивність у задачах з високою ентропією. Byte Latent Transformer (BLT) від Meta AI спрямований на розв'язання цих проблем, повністю усуваючи токенізацію. BLT є архітектурою без токенізатора, яка обробляє "сирі" байтові послідовності й динамічно групує їх у патчі залежно від складності даних. Цей підхід забезпечує ефективне масштабування, досягаючи або перевершуючи продуктивність моделей на основі токенізації, одночасно покращуючи стійкість і ефективність інференсу.
"Нейронний рендеринг" може стати новою ШІ-магією в графічних процесорах наступного покоління Nvidia RTX 50-серії
Одразу після підтвердження інформації про надпотужну відеокарту RTX 5090 із 32 ГБ пам’яті від Nvidia з’явилися новини, компанія, можливо, готує масштабне покращення, підсилене штучним інтелектом. Воно зробить графіку в іграх на крок ближчою до повністю відтвореної нейронними мережами. Іншими словами, ігри більше не будуть рендеритись за допомогою традиційного 3D-пайплайну, а повністю створюватимуться нейронними мережами.
Google спрощує вимоги для своїх клієнтів з високоризикових сфер щодо використання ШІ-продуктів компанії, незважаючи на посилення загальних регуляторних вимог щодо використання ШІ-інструментів у високоризикових сферах
Згідно з оновленою політикою Generative AI Prohibited Use Policy, опублікованою у вівторок, клієнтам дозволяється використовувати генеративний ШІ Google для ухвалення "автоматизованих рішень", які можуть мати "суттєвий негативний вплив на права особи". За умови певного людського нагляду, клієнти можуть застосовувати ШІ для прийняття рішень у таких "високоризикових" сферах, як працевлаштування, житло, страхування, соціальне забезпечення тощо. Здається, що цей промо-хід направлено на відвойовування долі ринку у конкурентів (таких як OpenAI та Anthropic), які мають суворіші правила щодо використання їхніх систем для високоризикових автоматизованих рішень.
Провідні AI-чат-боти демонструють когнітивний спад, схожий на деменцію, у тестах, що викликає запитання щодо їхнього майбутнього в медицині
Майже всі провідні моделі великих мовних моделей, або "чат-боти", демонструють ознаки легкого когнітивного порушення у тестах, які широко використовуються для виявлення ранніх ознак деменції, як показало дослідження, опубліковане в різдвяному випуску журналу BMJ. Хоча численні дослідження вже показали, що великі мовні моделі (LLMs) можуть ефективно виконувати широкий спектр медичних діагностичних завдань, їхню вразливість до "людських" проблем, таких як когнітивний спад, ще не вивчали. Щоб заповнити цю прогалину, дослідники оцінили когнітивні здібності провідних загальнодоступних LLM-моделей — ChatGPT версій 4 і 4o (розроблених OpenAI), Claude 3.5 “Sonnet” (розробленої Anthropic) та Gemini версій 1 і 1.5 (розроблених Alphabet) — використовуючи тест Монреальської оцінки когнітивних функцій (MoCA). ChatGPT 4o отримав найвищий бал у тесті MoCA (26 із 30), за ним ідуть ChatGPT 4 і Claude (25 із 30), а найгірший результат показала модель Gemini 1.0 (16 із 30).
OpenAI представила нові інструменти для розробників, серед яких OpenAI o1, оновлення Realtime API, новий метод налаштування моделей і багато іншого
Нові інструменти для налаштування та оновлення покращують продуктивність, гнучкість і економічну ефективність для розробників, що працюють із ШІ.
Серед новинок:
1. OpenAI o1 у API, з підтримкою виклику функцій, повідомлень для розробників, структурованих результатів і можливостей роботи із зображеннями.
2. Оновлення Realtime API, включно з інтеграцією WebRTC, зниженням ціни на аудіо GPT-4o на 60% і підтримкою GPT-4o mini за ціною в десять разів меншою за попередні тарифи на аудіо.
3. Preference Fine-Tuning, новий метод налаштування моделей, що дозволяє легше адаптувати моделі відповідно до потреб користувачів і розробників.
4. Нові SDK для Go та Java, які вже доступні у бета-версії.
Митці та медіа Великобританії відхилили план дозволити компаніям зі ШІ використовувати матеріали, захищені авторським правом
Коаліція музикантів, фотографів та видавців наполягає на дотриманні чинних законів про авторське право. Письменники, видавці, музиканти, фотографи, кінопродюсери та газети відхилили план уряду Лейбористської партії створити виняток із законів про авторське право для допомоги ШІ-компаніям у навчанні їхніх алгоритмів. Голова парламентського комітету з питань культури, медіа та спорту від Консервативної партії Каролайн Діненейдж звинуватила уряд у тому, що він "повністю піддався впливу ідеї про переваги ШІ".
Сотні співробітників OpenAI отримають багатомільйонні виплати через приватний продаж акцій
Близько 400 нинішніх і колишніх співробітників OpenAI зможуть отримати значні виплати в рамках приватного продажу акцій, організованого японською компанією SoftBank Group. Ця угода, приурочена до святкового сезону, дозволяє учасникам продати свої акції за ціною $210 за штуку, що відповідає останній оцінці компанії у $157 мільярдів.
Штучний інтелект перевершує людських експертів у визначенні американського віскі та шотландського віскі
Штучний інтелект може точніше, ніж людські експерти, відрізнити шотландський віскі від американського бурбону та визначити основні аромати, використовуючи дані, а не дегустацію напоїв. Андреас Ґраскамп із Інституту інженерії процесів і упаковки Фраунгофера (Німеччина) разом із колегами навчив алгоритм молекулярного передбачення запахів OWSum на основі описів різних віскі.