Главная / NVIDIA / NVIDIA P104 100: Производительность и характеристики

NVIDIA P104 100

NVIDIA P104 100: Гибрид прошлого и будущего? Подробный обзор видеокарты 2025 года

Введение

В 2025 году рынок GPU продолжает удивлять: новые технологии соседствуют с переработанными решениями. Видеокарта NVIDIA P104 100 — любопытный пример такого синтеза. Несмотря на название, отсылающее к архитектуре Pascal (2016 г.), эта модель получила современные фишки вроде трассировки лучей и DLSS. Разбираемся, кому подойдет этот гибрид и насколько он актуален в эпоху RTX 50-й серии и Radeon RX 8000.

1. Архитектура и ключевые особенности

Архитектура «Ada Lite» и 5-нм процесс

NVIDIA P104 100 базируется на упрощенной версии архитектуры Ada Lovelace, которую компания обозначила как «Ada Lite». Карта производится по 5-нм техпроцессу TSMC, что обеспечивает баланс между энергоэффективностью и производительностью.

RTX и DLSS 3.5: неожиданный апгрейд

Несмотря на позиционирование как бюджетной модели, P104 100 получила RT-ядра третьего поколения и Tensor-ядра для DLSS 3.5. Это позволяет запускать трассировку лучей в играх вроде Cyberpunk 2077: Phantom Liberty с приемлемым FPS. DLSS 3.5 с технологией Ray Reconstruction улучшает детализацию даже в 4K.

FidelityFX Super Resolution: кросс-платформенная поддержка

Карта совместима с FSR 3.0 от AMD, что полезно для проектов без DLSS. Например, в Starfield FSR даёт прирост до 25% FPS при разрешении 1440p.

2. Память: GDDR6 и оптимизация потоков

8 ГБ GDDR6 и 192-битная шина

Объём памяти — 8 ГБ GDDR6 с пропускной способностью 384 ГБ/с (частота 16 ГГц). Этого хватает для большинства игр на высоких настройках, но в 4K с RTX в некоторых сценах возможны подтормаживания из-за нехватки VRAM.

Влияние на производительность

В тестах Hogwarts Legacy (1440p, ультра) P104 100 выдает 68 FPS, но при активации RTX падение до 43 FPS компенсируется DLSS 3.5 (Balanced Mode — 58 FPS). Для монтажа 4K-видео в DaVinci Resolve 8 ГБ достаточно, но рендеринг сложных 3D-сцен в Blender может требовать оптимизации.

3. Производительность в играх: цифры и разрешения

1080p: идеальный баланс

- Apex Legends (макс. настройки): 144 FPS.

- Elden Ring (качество + RTX): 72 FPS с DLSS.

- Call of Duty: Modern Warfare V: 110 FPS.

1440p: комфорт для мониторов с высокой частотой

- Cyberpunk 2077 (RT Ultra): 48 FPS → 65 FPS с DLSS 3.5.

- Assassin’s Creed Mirage: 78 FPS.

4K: только с DLSS/FSR

- Red Dead Redemption 2 (ультра): 34 FPS → 55 FPS с DLSS Performance.

- Forza Horizon 6: 62 FPS (FSR 3.0 Quality).

Трассировка лучей: доступна, но с оговорками

RTX-эффекты в Metro Exodus Enhanced Edition снижают FPS на 30%, но DLSS 3.5 нивелирует потери. Без апскейлинга играть в 4K с RTX почти невозможно.

4. Профессиональные задачи: не только игры

CUDA и OpenCL: расчеты и рендеринг

- Blender (Cycles): рендеринг сцены BMW — 4 минуты (против 6 мин у RTX 3050).

- DaVinci Resolve: 8K-проекты редактируются плавно, но экспорт на 20% медленнее, чем у RTX 4070.

- Научные расчеты: поддержка CUDA 8.9 ускоряет задачи в MATLAB и Python (например, обучение нейросетей на датасетах среднего размера).

Ограничения:

- Малый объём VRAM для сложных симуляций в ANSYS.

- Нет аппаратной кодировки AV1 — только H.265.

5. Энергопотребление и тепловыделение

TDP 150 Вт: скромные аппетиты

Карта потребляет на 30% меньше, чем RTX 4060 Ti (160 Вт), благодаря оптимизированному 5-нм процессу.

Рекомендации по охлаждению

- Достаточно 2-слотового кулера с двумя вентиляторами (температура под нагрузкой — 72°C).

- Для компактных корпусов: модели с 3-мя heat-pipe (максимальный шум — 32 дБ).

- Идеальный корпус: с 2-мя вентиляторами на вдув и 1 на выдув (например, Fractal Design Meshify C).

6. Сравнение с конкурентами

NVIDIA RTX 4050 (2024):

- Плюсы P104 100: +15% производительности в 1440p, поддержка DLSS 3.5.

- Минусы: RTX 4050 эффективнее в энергопотреблении (130 Вт).

AMD Radeon RX 7600 XT:

- Плюсы AMD: 12 ГБ GDDR6, FSR 3.0 в большинстве игр.

- Минусы: слабее в рендеринге из-за отсутствия аналога CUDA.

Intel Arc A770:

- Плюсы Intel: 16 ГБ VRAM, поддержка AV1.

- Минусы: драйверы всё ещё отстают в оптимизации.

7. Практические советы

Блок питания: 500 Вт (рекомендуется 550 Вт для запаса). Лучшие варианты: Corsair CX550M (80+ Bronze), Be Quiet! Pure Power 11.

Совместимость:

- PCIe 4.0 x16 (обратная совместимость с 3.0).

- Рекомендуемый процессор: AMD Ryzen 5 7600 или Intel Core i5-13400F.

Драйверы:

- Game Ready Driver 555.20 стабилен, но для профессиональных задач лучше Studio Driver.

- Известная проблема: случайные вылеты в Vulkan-приложениях — помогает откат до версии 552.10.

8. Плюсы и минусы

Плюсы:

- Доступная цена: $329 (новые модели, апрель 2025).

- Поддержка DLSS 3.5 и FSR 3.0.

- Низкое энергопотребление.

Минусы:

- Всего 8 ГБ VRAM — ограничение для 4K и профессиональных задач.

- Отсутствие AV1-кодирования.

9. Итоговый вывод: кому подойдёт P104 100?

Эта видеокарта — удачный выбор для:

- Геймеров с монитором 1440p, желающих активировать RTX без серьёзных вложений.

- Монтажёров и дизайнеров, работающих с проектами средней сложности.

- Владельцев ПК с БП малой мощности (например, апгрейд старых систем).

Альтернативы: Если нужен запас VRAM — RX 7600 XT ($349), если важен AV1 — Intel Arc A770 ($299).

Заключение

NVIDIA P104 100 доказывает, что даже в 2025 году можно совместить доступность и современные технологии. Это не топовая модель, но её хватит для комфортной игры и работы — главное, не ждать чудес в 8K.

Общая информация

Производитель

NVIDIA

Платформа

Desktop

Дата выпуска

December 2017

Название модели

P104 100

Поколение

Mining GPUs

Базоввая частота

1607MHz

Boost Частота

1733MHz

Интерфейс шины

PCIe 3.0 x16

Транзисторы

7,200 million

TMU

Блоки наложения текстур (TMU) служат компонентами графического процессора, которые способны вращать, масштабировать и искажать двоичные изображения, а затем размещать их в виде текстур на любой плоскости заданной трехмерной модели. Этот процесс называется отображением текстур.

120

Производитель

TSMC

Размер процесса

16 nm

Архитектура

Pascal

Характеристики памяти

Объем памяти

4GB

Тип памяти

GDDR5X

Шина памяти

Ширина шины памяти обозначает количество бит данных, которые видеопамять может передать за один такт. Чем больше ширина шины, тем больший объем данных может быть передан мгновенно, что делает ее одним из важнейших параметров видеопамяти. Пропускная способность памяти рассчитывается как: Пропускная способность памяти = Частота памяти x Ширина шины памяти / 8. Следовательно, если частоты памяти одинаковы, ширина шины памяти будет определять размер пропускной способности памяти.

256bit

Частота памяти

1251MHz

Пропускная способность

Пропускная способность памяти — это скорость передачи данных между графическим чипом и видеопамятью. Он измеряется в байтах в секунду, и формула для его расчета: пропускная способность памяти = рабочая частота × ширина шины памяти / 8 бит.

320.3 GB/s

Теоретическая производительность

Пиксельный филлрейт

Скорость заполнения пикселей — это количество пикселей, которые графический процессор (GPU) может визуализировать в секунду, измеряется в мегапикселях/с (миллион пикселей в секунду) или GPixels/s (миллиард пикселей в секунду). Это наиболее часто используемый показатель для оценки производительности обработки пикселей видеокарты.

110.9 GPixel/s

Текстурный филлрейт

Скорость заполнения текстуры — это количество элементов карты текстур (текселей), которые графический процессор может сопоставить с пикселями за одну секунду.

208.0 GTexel/s

FP16 (half)

Важным показателем для измерения производительности графического процессора являются возможности вычислений с плавающей запятой. Числа с плавающей запятой половинной точности (16 бит) используются в таких приложениях, как машинное обучение, где допустима более низкая точность. Числа с плавающей запятой одинарной точности (32-битные) используются для обычных задач обработки мультимедиа и графики, а числа с плавающей запятой двойной точности (64-битные) необходимы для научных вычислений, требующих широкого числового диапазона и высокой точности.

104.0 GFLOPS

FP64 (double)

Важным показателем для измерения производительности графического процессора являются возможности вычислений с плавающей запятой. Числа с плавающей запятой двойной точности (64-битные) необходимы для научных вычислений, требующих широкого числового диапазона и высокой точности, а числа с плавающей запятой одинарной точности (32-битные) используются для обычных задач обработки мультимедиа и графики. Числа с плавающей запятой половинной точности (16 бит) используются в таких приложениях, как машинное обучение, где допустима более низкая точность.

208.0 GFLOPS

FP32 (float)

Важным показателем для измерения производительности графического процессора являются возможности вычислений с плавающей запятой. Числа с плавающей запятой одинарной точности (32-битные) используются для обычных задач обработки мультимедиа и графики, а числа с плавающей запятой двойной точности (64-битные) необходимы для научных вычислений, требующих широкого числового диапазона и высокой точности. Числа с плавающей запятой половинной точности (16 бит) используются в таких приложениях, как машинное обучение, где допустима более низкая точность.

6.522 TFLOPS

Другое

Потоковый мультипроцессор (SM)

Несколько потоковых процессоров (SP) вместе с другими ресурсами образуют потоковый мультипроцессор (SM), который также называется основным ядром графического процессора. Эти дополнительные ресурсы включают в себя такие компоненты, как планировщики деформации, регистры и общую память. SM можно считать сердцем графического процессора, аналогично ядру ЦП, при этом регистры и общая память являются дефицитными ресурсами внутри SM.

Блоки шейдинга

Самым фундаментальным процессором является потоковый процессор (SP), в котором выполняются определенные инструкции и задачи. Графические процессоры выполняют параллельные вычисления, что означает, что несколько процессоров SP работают одновременно для обработки задач.

1920

Кэш L1

48 KB (per SM)

Кэш L2

2MB

TDP

130W

Версия Vulkan

Vulkan — это кроссплатформенный графический и вычислительный API от Khronos Group, предлагающий высокую производительность и низкую нагрузку на процессор. Он позволяет разработчикам напрямую управлять графическим процессором, снижает затраты на рендеринг и поддерживает многопоточные и многоядерные процессоры.

1.3

Версия OpenCL

3.0

OpenGL

4.6

DirectX

12 (12_1)

CUDA

6.1

Разъемы питания

1x 8-pin

Шейдерная модель

6.4

ROP

Конвейер растровых операций (ROP) в первую очередь отвечает за расчеты освещения и отражений в играх, а также за управление такими эффектами, как сглаживание (AA), высокое разрешение, дым и огонь. Чем более требовательны к сглаживанию и световым эффектам в игре, тем выше требования к производительности для ROP; в противном случае это может привести к резкому падению частоты кадров.

Требуемый блок питания

200W

Бенчмарки

FP32 (float)

6.522 TFLOPS

Blender

612

OctaneBench

122

Vulkan

45859

OpenCL

52079

По сравнению с другими GPU

FP32 (float) / TFLOPS

Radeon RX 590

6.977 +7%

Quadro P5000 Mobile

6.61 +1.3%

P104 100

6.522

GeForce GTX 980 Ti

6.181 -5.2%

GeForce RTX 2050 Mobile

5.929 -9.1%

Blender

GeForce RTX 3060

2115.71 +245.7%

Radeon 8060S

1224.91 +100.1%

P104 100

612

Quadro M5000

323 -47.2%

Quadro M1000M

126 -79.4%

OctaneBench

A100 SXM4 80 GB

526 +331.1%

GeForce RTX 2080 Ti 12 GB

247 +102.5%

P104 100

122

Quadro M4000M

67 -45.1%

GeForce GTX 750 Ti

35 -71.3%

Vulkan

Radeon Pro Vega II

100987 +120.2%

GeForce RTX 2060

72046 +57.1%

P104 100

45859

GeForce GTX 960

20775 -54.7%

GeForce MX150

8986 -80.4%

OpenCL

Radeon Pro Vega II

99542 +91.1%

Radeon RX 6800S

72374 +39%

P104 100

52079

FirePro S10000

30631 -41.2%

GeForce GTX 880M

15023 -71.2%