2 апреля 2025 г.

Мой личный рейтинг нейросетей после испытаний: Qwen, Deepseek, Mistral


Я тот странный человек, который в 2025 году не занимается vibe coding и не пишет свои тексты с помощью нейросетей, а пишет их лично, стуча пальцами по своей новенькой механической клавиатуре. Вот такой я старомодный и возможно в ближайшие годы эти занятия (программирование и написание текстов) исчезнут совсем, но я всегда любил лично выражать свои мысли, хотя в последние годы это всё труднее и труднее. Мы живём в удивительное время и я даже не про политическую обстановку в мире, а про технологическую сингулярность к которой мы наконец подходим. Я писал об этом в своём блоге годы назад и вот наконец это свершилось и уже не надо никому доказывать, что нейросети и развитие AI навсегда изменят Интернет и нашу жизнь - это та самая next big thing. Про блокчейн забудем пока - мы теперь все эксперты по LLM. 

Попросил сгенерировать картинку vibe coder

Все деньги мира сейчас вливаются в эту отрасль, самые умные люди планеты придумывают новые штуки и выкладывают обновлённые модели почти каждый день. И это очень хорошо для нас, для простых пользователей, потому что мы можем бесплатно попробовать "будущее" и протестировать самые новейшие модели для программирования, генерации музыки, текстов и изображений с видео. Да, многим не нравится такой контент (я тоже считаю нейротексты бездушным мусором), но хотим мы или нет - революция свершилась. 

Окно чата Qwen

В первую очередь я попробовал нейросети для своего любимого хобби - для программирования. Простенький проект в виде веб-сервера на Node, который выдаёт страницу на htmx со списком статей и обращается при этом к облачной базе данных. Китайский Qwen без проблем мне в три захода выдал 100 строк кода, которые  я легко мог написать сам, но сделал бы это за 30 минут с чтением документации. DeepSeek справился не хуже, французский Mistral выдал устаревший код (я использовал довольно новую библиотеку для сервера, которая появилась после 2023 года), зато сделал это очень быстро. Впрочем читать документацию мне тоже пришлось, чтобы кое-что исправить (я запускал сервер через Deno, а там свои особенности с управлением пакетами), но код изначально был рабочим. На Ютубе вы можете найти и более впечатляющие примеры работы с нейросетями, когда они от начала до конца создают React приложение и если это очень простое приложение, которое кто-то уже писал (условный todo list), то проблем не будет, но стоит начать делать что-то необычное и уникальное... то результат может быть весьма плачевным, потому что все нейросети учились на примерах с Github или из статей в Интернете, а там очень посредственный и небезопасный код, который написали начинающие программисты для обучения. Уж поверьте мне, пересмотревшему кучу туториалов по фронтенду на Ютубе: там очень нечасто можно встретить примеры хорошего кода для "продакшена", просто потому-что его долго писать. Так как такой качественный код закрыт под NDA в приватных репозиториях и доступа нейросетей к ним во время обучения не было, то сами понимаете на чём они учились. 

Второе практическое использование AI случилось совсем недавно, когда один из моих близких родственников тяжело заболел. Модель Qwen не только выдала диагноз, совпавший с диагнозом настоящего врача по описанным симптомам, но и посоветовала тот же список лекарств, который выдал врач из платной клиники, где берут несколько тысяч рублей за приём. Я ни в коем случае не призываю заменять настоящих врачей нейросетями и заниматься самолечением (это опасно!), но уже сейчас китайская модель способна если не заменить обычного терапевта в поликлинике, то очень сильно помочь им - ну вы сами знаете как работают эти работники медицины и их уровень подготовки, вряд ли нейронка может навредить. Потом модель Qwen смогла проанализировать загруженный в неё pdf документ с анализами крови и скорректировать лечение, расписав в какой последовательности и как принимать выписанные врачом лекарства, попутно ещё объяснив какое лекарство для чего нужно. Впечатляющий сервис! Нейронки в медицине это тоже будущее, ведь они обладают доступом к огромному числу знаний, анализируют гигантское количество параметров, совместимость препаратов для конкретного пациента и уже сейчас есть примеры, как передовые модели придумывают новые уникальные лекарственные препараты и выдвигают смелые научные теории. 

Таким образом в данный момент моим основным AI (я в курсе, что интеллектом там не пахнет, но так уж принято их называть) стал Qwen от китайской компании Alibaba. Эта модель не так сильно "хайпанула" как DeepSeek, но уже сейчас она умеет функцию "думать" и поиск по интернету, в то время как эти функции у DeepSeek частенько просто не работают из-за загруженных серверов. Кроме того она работает очень быстро, умеет извлекать данные из загруженных документов и картинок, а так же бесплатно генерирует картинки (правда долго и плохо) и работает со звуками. По скорости работы Qwen сравнима с Mistral и я даже не знаю как они добились такой быстрой работы. 

В будущем нас ждут ещё более впечатляющие примеры работы с нейросетями, благо их развитие не останавливается, но я предупреждаю вас о том, что нельзя безоговорочно доверять информации от них, потому что эту информацию можно "отравить" (создание фейковых сайтов СМИ для продвижения своей повестки), имеется проблема "галлюцинаций" и проблема с персональными данными - особенно это касается китайских моделей, которые всё введенное вами будут использовать для своего дальнейшего обучения. Мы живём в удивительное время.