Trending

#бенчмарки

Latest posts tagged with #бенчмарки on Bluesky

Posts tagged #бенчмарки

Post image

Kimi K2.5 наступает на пятки GPT-5.4. И работает из России без VPN Бенчмарков сейчас – как нейросетей: каждую неделю ...

#исследование #бенчмарки #ии #gigachat #yandexgpt

Origin | Interest | Match

1 0 0 0
Post image

DeepMind определил тест для AGI Почти три года назад Google DeepMind опубликовала Levels of AGI - работу, которая определила пя...

#AGI #Google #DeepMind #бенчмарки #когнитивная #психология #оценка #моделей #LLM #нейросети #машинное

Origin | Interest | Match

0 0 0 0
Post image

9 агентов, 6 моделей, 1 сервер: как собрать ИИ-компанию на open-source в марте 2026 Я собрал команду из 9 ИИ-агентов, кот...

#LLM #open-source #мульти-агентные #системы #MoE #Qwen #DeepSeek #GPU #VRAM #бенчмарки #agent

Origin | Interest | Match

1 0 0 0
Post image

Как мы автоматизировали анализ бенчмарков: опыт команды Postgres Professional Проводить нагрузочное тестирование Post...

#базы #данных #postgresql #математика #аналитика #бенчмарки

Origin | Interest | Match

0 0 0 0
Post image

Когда нейросеть решит то, что не решил никто? В середине 2024 года GPT-4 спотыкался на школьных задачах, а к концу...

#FrontierMath #Epoch #AI #LLM #бенчмарки #открытые #задачи #GPT-5 #Gemini #теория #чисел

Origin | Interest | Match

0 0 0 0
Post image

[Перевод] Большим GPU не нужны большие PC С тех пор, как я научил графические карты AMD , Intel и Nvidia работать с Raspbe...

#llm #nvidia #amd #radeon #локальные #нейросети #бенчмарки #ruvds_переводы

Origin | Interest | Match

0 0 0 0
Post image

[Перевод] Как оптимизировать код WebAssembly при помощи встраивания функций и деоптимизации В этом посте будут о...

#бенчмарки #webassembly #программирование #браузеры #оптимизация

Origin | Interest | Match

1 0 0 0
Post image

[Перевод] Как оптимизировать код WebAssembly при помощи встраивания функций и деоптимизации В этом посте будут о...

#бенчмарки #webassembly #программирование #браузеры #оптимизация

Origin | Interest | Match

1 0 0 0
Post image

Google Gemini 3 Pro впервые обогнал GPT-5: результаты бенчмарков показали нового лидера ИИ-гонки Ноябрь 2025 года стал п...

#chatgpt #5.2 #gemini #3 #pro #бенчмарки #lmarena #humanitys #last #exam #aime

Origin | Interest | Match

0 0 0 0
Post image

ARC-AGI для оценки способностей ИИ и новый релиз ChatGPT 5.2 Вчера вышла новая версия модели ChatGPT 5.2 . В очередной ра...

#искусственный #интеллект #машинное #обучение #новости #бенчмарки #бенчмаркинг #тестирование #моделей #генеративный #ии

Origin | Interest | Match

0 0 0 0
Preview
Бенчмарк конца эпохи — Humanity’s Last Exam Хочу сегодня рассказать вам про Humanity’s Last Exam (HLE). Это один из главных бенчмарков, по которым сегодня оценивают модели искусственного интеллекта, вроде меня (шучу). Бенчмарки...

Бенчмарк конца эпохи — Humanity’s Last Exam Хочу сегодня рассказать вам про Humanity’s Last Exam (HLE). Это один из главных б...

#hle #бенчмарки #ии #llm #benchmarks #ai #fun

Origin | Interest | Match

0 0 0 0
Post image

[Перевод] LLM Evals: движущая сила новой эры ИИ в бизнесе На днях OpenAI опубликовали в своем блоге небольшую статью...

#ии #искусственный #интеллект #LLM #openai #evals #benchmarks #бенчмарки #llm #evals #оценки

Origin | Interest | Match

0 0 0 0
Post image

Текстовые игры возвращаются? Новые сферы применения, а также некоторые руководства и ресурсы для разработк...

#beeline #cloud #текстовые #игры #llm #бенчмарки #критическое #мышление #геймдев

Origin | Interest | Match

0 0 0 0
Post image

Бенчмарки для теста телефона на производительность Привет, Хабр! Производительность мобильного устройст...

#selectel #android #тестирование #мобильных #приложений #тестирование #бенчмарки

Origin | Interest | Match

0 0 0 0
Post image

SWE-MERA — новый динамический бенчмарк для моделей агентной генерации кода Всем привет! Пару месяцев Альянс в ...

#агентное #программирование #llm #llm-агент #llm-модели #бенчмарки

Origin | Interest | Match

0 0 0 0
Post image

Тестируем пять моделей DeepSeek R1 и Qwen3 на серверах YADRO Привет, Хабр. Меня зовут Дмитрий Крюков, я инженер по разр...

#tmp #бенчмарки #deepseek #ai #qwen #llm #vegman

Origin | Interest | Match

0 0 0 0
Post image

ChatGPT 5 вышел! Что нового, бенчмарки и как получить доступ из России В четверг, 7 августа, в 20:00 по мск состоял...

#chatgpt #5 #openai #сэм #альтман #agi #вайбкодинг #бенчмарки

Origin | Interest | Match

0 0 0 0
Post image

Битрикс24 бенчмарк для оценки LLM Картинка сгенерированая по запросу "сгенерируй картинку про битрикс24 и и...

#битрикс24 #llm #ии #чат-бот #gemini #бенчмаркинг #бенчмарки #бям #бенчмарк #кода #битрикс

Origin | Interest | Match

1 0 0 0
Битрикс24 бенчмарк для оценки LLM

Битрикс24 бенчмарк для оценки LLM В преддверии выхода GPT-5 хотелось сделать бенчмарк который по-настоящему про...

#gemini #llm #бенчмарк #кода #бенчмарки #бям #бенчмаркинг #битрикс #отладка #веб-разработка #Битрикс24

Origin | Interest | Match

1 0 0 0
Post image

ChatGPT o3 Pro: новый флагман OpenAI или маркетинговый ход? Разбираемся OpenAI снова удивляет: новая модель ChatGPT o3 Pro об...

#chatgpt #o3 #pro #openai #бенчмарки #aime #gpqa #codeforces #chatbot #arena #nyt

Origin | Interest | Match

0 0 0 0
Post image

ChatGPT o1 pro: Обзор бенчмарков и тест модели Доброго времени суток, «Хабр»! Сегодня мы детально разберём, протес...

#o1-pro #обзор #бенчмарки

Origin | Interest | Match

0 0 0 0
Post image

Кто быстрее? Тестируем скорость языков программирования на Эльбрусе Приветствую! Я разработчик в компании ...

#эльбрус #тестирование #сравнение #производительности #linux #бенчмарки

Origin | Interest | Match

0 0 0 0
Post image

Тестирование производительности видеокарт на приме...


#бенчмарки #llm #llama.cpp #машинное+обучение #видеокарты #нагрузочное #тестирование
Origin | Interest | Match

0 0 0 0
Post image

[Перевод] Автоматическое обнаружение возможностей ч...

habr.com/ru/articles/893634/

#LLM #ACD #бенчмарки #оценка #моделей

Event Attributes

0 0 0 0
Preview
Автоматическое обнаружение возможностей через самоисследование базовых моделей Это перевод свежей статьи от 12 февраля 2025 года об Automated Capability Discovery (ACD) — автоматическом обнаружении возможностей и ограничений больших языковых моделей (LLM), таких как GPT, Claude...

[Перевод] Автоматическое обнаружение возможностей ч...

habr.com/ru/articles/893634/

#LLM #ACD #бенчмарки #оценка #моделей

Event Attributes

0 0 0 0
Post image

Уроки химии: AMORE проверит готовность химических язык...

habr.com/ru/companies/airi/articl...

#Химия #языковые #модели #NLP #ChemLM #llm #бенчмарки

Event Attributes

0 0 0 0