Kimi K2.5 наступает на пятки GPT-5.4. И работает из России без VPN Бенчмарков сейчас – как нейросетей: каждую неделю ...
#исследование #бенчмарки #ии #gigachat #yandexgpt
Origin | Interest | Match
Latest posts tagged with #бенчмарки on Bluesky
Kimi K2.5 наступает на пятки GPT-5.4. И работает из России без VPN Бенчмарков сейчас – как нейросетей: каждую неделю ...
#исследование #бенчмарки #ии #gigachat #yandexgpt
Origin | Interest | Match
DeepMind определил тест для AGI Почти три года назад Google DeepMind опубликовала Levels of AGI - работу, которая определила пя...
#AGI #Google #DeepMind #бенчмарки #когнитивная #психология #оценка #моделей #LLM #нейросети #машинное
Origin | Interest | Match
9 агентов, 6 моделей, 1 сервер: как собрать ИИ-компанию на open-source в марте 2026 Я собрал команду из 9 ИИ-агентов, кот...
#LLM #open-source #мульти-агентные #системы #MoE #Qwen #DeepSeek #GPU #VRAM #бенчмарки #agent
Origin | Interest | Match
Как мы автоматизировали анализ бенчмарков: опыт команды Postgres Professional Проводить нагрузочное тестирование Post...
#базы #данных #postgresql #математика #аналитика #бенчмарки
Origin | Interest | Match
Когда нейросеть решит то, что не решил никто? В середине 2024 года GPT-4 спотыкался на школьных задачах, а к концу...
#FrontierMath #Epoch #AI #LLM #бенчмарки #открытые #задачи #GPT-5 #Gemini #теория #чисел
Origin | Interest | Match
[Перевод] Большим GPU не нужны большие PC С тех пор, как я научил графические карты AMD , Intel и Nvidia работать с Raspbe...
#llm #nvidia #amd #radeon #локальные #нейросети #бенчмарки #ruvds_переводы
Origin | Interest | Match
[Перевод] Как оптимизировать код WebAssembly при помощи встраивания функций и деоптимизации В этом посте будут о...
#бенчмарки #webassembly #программирование #браузеры #оптимизация
Origin | Interest | Match
[Перевод] Как оптимизировать код WebAssembly при помощи встраивания функций и деоптимизации В этом посте будут о...
#бенчмарки #webassembly #программирование #браузеры #оптимизация
Origin | Interest | Match
Google Gemini 3 Pro впервые обогнал GPT-5: результаты бенчмарков показали нового лидера ИИ-гонки Ноябрь 2025 года стал п...
#chatgpt #5.2 #gemini #3 #pro #бенчмарки #lmarena #humanitys #last #exam #aime
Origin | Interest | Match
ARC-AGI для оценки способностей ИИ и новый релиз ChatGPT 5.2 Вчера вышла новая версия модели ChatGPT 5.2 . В очередной ра...
#искусственный #интеллект #машинное #обучение #новости #бенчмарки #бенчмаркинг #тестирование #моделей #генеративный #ии
Origin | Interest | Match
Бенчмарк конца эпохи — Humanity’s Last Exam Хочу сегодня рассказать вам про Humanity’s Last Exam (HLE). Это один из главных б...
#hle #бенчмарки #ии #llm #benchmarks #ai #fun
Origin | Interest | Match
[Перевод] LLM Evals: движущая сила новой эры ИИ в бизнесе На днях OpenAI опубликовали в своем блоге небольшую статью...
#ии #искусственный #интеллект #LLM #openai #evals #benchmarks #бенчмарки #llm #evals #оценки
Origin | Interest | Match
Текстовые игры возвращаются? Новые сферы применения, а также некоторые руководства и ресурсы для разработк...
#beeline #cloud #текстовые #игры #llm #бенчмарки #критическое #мышление #геймдев
Origin | Interest | Match
Бенчмарки для теста телефона на производительность Привет, Хабр! Производительность мобильного устройст...
#selectel #android #тестирование #мобильных #приложений #тестирование #бенчмарки
Origin | Interest | Match
SWE-MERA — новый динамический бенчмарк для моделей агентной генерации кода Всем привет! Пару месяцев Альянс в ...
#агентное #программирование #llm #llm-агент #llm-модели #бенчмарки
Origin | Interest | Match
Тестируем пять моделей DeepSeek R1 и Qwen3 на серверах YADRO Привет, Хабр. Меня зовут Дмитрий Крюков, я инженер по разр...
#tmp #бенчмарки #deepseek #ai #qwen #llm #vegman
Origin | Interest | Match
ChatGPT 5 вышел! Что нового, бенчмарки и как получить доступ из России В четверг, 7 августа, в 20:00 по мск состоял...
#chatgpt #5 #openai #сэм #альтман #agi #вайбкодинг #бенчмарки
Origin | Interest | Match
Битрикс24 бенчмарк для оценки LLM Картинка сгенерированая по запросу "сгенерируй картинку про битрикс24 и и...
#битрикс24 #llm #ии #чат-бот #gemini #бенчмаркинг #бенчмарки #бям #бенчмарк #кода #битрикс
Origin | Interest | Match
Битрикс24 бенчмарк для оценки LLM В преддверии выхода GPT-5 хотелось сделать бенчмарк который по-настоящему про...
#gemini #llm #бенчмарк #кода #бенчмарки #бям #бенчмаркинг #битрикс #отладка #веб-разработка #Битрикс24
Origin | Interest | Match
ChatGPT o3 Pro: новый флагман OpenAI или маркетинговый ход? Разбираемся OpenAI снова удивляет: новая модель ChatGPT o3 Pro об...
#chatgpt #o3 #pro #openai #бенчмарки #aime #gpqa #codeforces #chatbot #arena #nyt
Origin | Interest | Match
ChatGPT o1 pro: Обзор бенчмарков и тест модели Доброго времени суток, «Хабр»! Сегодня мы детально разберём, протес...
#o1-pro #обзор #бенчмарки
Origin | Interest | Match
Кто быстрее? Тестируем скорость языков программирования на Эльбрусе Приветствую! Я разработчик в компании ...
#эльбрус #тестирование #сравнение #производительности #linux #бенчмарки
Origin | Interest | Match
Тестирование производительности видеокарт на приме...
#бенчмарки #llm #llama.cpp #машинное+обучение #видеокарты #нагрузочное #тестирование
Origin | Interest | Match
[Перевод] Автоматическое обнаружение возможностей ч...
habr.com/ru/articles/893634/
#LLM #ACD #бенчмарки #оценка #моделей
Event Attributes
[Перевод] Автоматическое обнаружение возможностей ч...
habr.com/ru/articles/893634/
#LLM #ACD #бенчмарки #оценка #моделей
Event Attributes
Уроки химии: AMORE проверит готовность химических язык...
habr.com/ru/companies/airi/articl...
#Химия #языковые #модели #NLP #ChemLM #llm #бенчмарки
Event Attributes