NVIDIA P104 100

NVIDIA P104 100

NVIDIA P104 100: Гибрид прошлого и будущего? Подробный обзор видеокарты 2025 года

Введение

В 2025 году рынок GPU продолжает удивлять: новые технологии соседствуют с переработанными решениями. Видеокарта NVIDIA P104 100 — любопытный пример такого синтеза. Несмотря на название, отсылающее к архитектуре Pascal (2016 г.), эта модель получила современные фишки вроде трассировки лучей и DLSS. Разбираемся, кому подойдет этот гибрид и насколько он актуален в эпоху RTX 50-й серии и Radeon RX 8000.


1. Архитектура и ключевые особенности

Архитектура «Ada Lite» и 5-нм процесс

NVIDIA P104 100 базируется на упрощенной версии архитектуры Ada Lovelace, которую компания обозначила как «Ada Lite». Карта производится по 5-нм техпроцессу TSMC, что обеспечивает баланс между энергоэффективностью и производительностью.

RTX и DLSS 3.5: неожиданный апгрейд

Несмотря на позиционирование как бюджетной модели, P104 100 получила RT-ядра третьего поколения и Tensor-ядра для DLSS 3.5. Это позволяет запускать трассировку лучей в играх вроде Cyberpunk 2077: Phantom Liberty с приемлемым FPS. DLSS 3.5 с технологией Ray Reconstruction улучшает детализацию даже в 4K.

FidelityFX Super Resolution: кросс-платформенная поддержка

Карта совместима с FSR 3.0 от AMD, что полезно для проектов без DLSS. Например, в Starfield FSR даёт прирост до 25% FPS при разрешении 1440p.


2. Память: GDDR6 и оптимизация потоков

8 ГБ GDDR6 и 192-битная шина

Объём памяти — 8 ГБ GDDR6 с пропускной способностью 384 ГБ/с (частота 16 ГГц). Этого хватает для большинства игр на высоких настройках, но в 4K с RTX в некоторых сценах возможны подтормаживания из-за нехватки VRAM.

Влияние на производительность

В тестах Hogwarts Legacy (1440p, ультра) P104 100 выдает 68 FPS, но при активации RTX падение до 43 FPS компенсируется DLSS 3.5 (Balanced Mode — 58 FPS). Для монтажа 4K-видео в DaVinci Resolve 8 ГБ достаточно, но рендеринг сложных 3D-сцен в Blender может требовать оптимизации.


3. Производительность в играх: цифры и разрешения

1080p: идеальный баланс

- Apex Legends (макс. настройки): 144 FPS.

- Elden Ring (качество + RTX): 72 FPS с DLSS.

- Call of Duty: Modern Warfare V: 110 FPS.

1440p: комфорт для мониторов с высокой частотой

- Cyberpunk 2077 (RT Ultra): 48 FPS → 65 FPS с DLSS 3.5.

- Assassin’s Creed Mirage: 78 FPS.

4K: только с DLSS/FSR

- Red Dead Redemption 2 (ультра): 34 FPS → 55 FPS с DLSS Performance.

- Forza Horizon 6: 62 FPS (FSR 3.0 Quality).

Трассировка лучей: доступна, но с оговорками

RTX-эффекты в Metro Exodus Enhanced Edition снижают FPS на 30%, но DLSS 3.5 нивелирует потери. Без апскейлинга играть в 4K с RTX почти невозможно.


4. Профессиональные задачи: не только игры

CUDA и OpenCL: расчеты и рендеринг

- Blender (Cycles): рендеринг сцены BMW — 4 минуты (против 6 мин у RTX 3050).

- DaVinci Resolve: 8K-проекты редактируются плавно, но экспорт на 20% медленнее, чем у RTX 4070.

- Научные расчеты: поддержка CUDA 8.9 ускоряет задачи в MATLAB и Python (например, обучение нейросетей на датасетах среднего размера).

Ограничения:

- Малый объём VRAM для сложных симуляций в ANSYS.

- Нет аппаратной кодировки AV1 — только H.265.


5. Энергопотребление и тепловыделение

TDP 150 Вт: скромные аппетиты

Карта потребляет на 30% меньше, чем RTX 4060 Ti (160 Вт), благодаря оптимизированному 5-нм процессу.

Рекомендации по охлаждению

- Достаточно 2-слотового кулера с двумя вентиляторами (температура под нагрузкой — 72°C).

- Для компактных корпусов: модели с 3-мя heat-pipe (максимальный шум — 32 дБ).

- Идеальный корпус: с 2-мя вентиляторами на вдув и 1 на выдув (например, Fractal Design Meshify C).


6. Сравнение с конкурентами

NVIDIA RTX 4050 (2024):

- Плюсы P104 100: +15% производительности в 1440p, поддержка DLSS 3.5.

- Минусы: RTX 4050 эффективнее в энергопотреблении (130 Вт).

AMD Radeon RX 7600 XT:

- Плюсы AMD: 12 ГБ GDDR6, FSR 3.0 в большинстве игр.

- Минусы: слабее в рендеринге из-за отсутствия аналога CUDA.

Intel Arc A770:

- Плюсы Intel: 16 ГБ VRAM, поддержка AV1.

- Минусы: драйверы всё ещё отстают в оптимизации.


7. Практические советы

Блок питания: 500 Вт (рекомендуется 550 Вт для запаса). Лучшие варианты: Corsair CX550M (80+ Bronze), Be Quiet! Pure Power 11.

Совместимость:

- PCIe 4.0 x16 (обратная совместимость с 3.0).

- Рекомендуемый процессор: AMD Ryzen 5 7600 или Intel Core i5-13400F.

Драйверы:

- Game Ready Driver 555.20 стабилен, но для профессиональных задач лучше Studio Driver.

- Известная проблема: случайные вылеты в Vulkan-приложениях — помогает откат до версии 552.10.


8. Плюсы и минусы

Плюсы:

- Доступная цена: $329 (новые модели, апрель 2025).

- Поддержка DLSS 3.5 и FSR 3.0.

- Низкое энергопотребление.

Минусы:

- Всего 8 ГБ VRAM — ограничение для 4K и профессиональных задач.

- Отсутствие AV1-кодирования.


9. Итоговый вывод: кому подойдёт P104 100?

Эта видеокарта — удачный выбор для:

- Геймеров с монитором 1440p, желающих активировать RTX без серьёзных вложений.

- Монтажёров и дизайнеров, работающих с проектами средней сложности.

- Владельцев ПК с БП малой мощности (например, апгрейд старых систем).

Альтернативы: Если нужен запас VRAM — RX 7600 XT ($349), если важен AV1 — Intel Arc A770 ($299).


Заключение

NVIDIA P104 100 доказывает, что даже в 2025 году можно совместить доступность и современные технологии. Это не топовая модель, но её хватит для комфортной игры и работы — главное, не ждать чудес в 8K.

Общая информация

Производитель
NVIDIA
Платформа
Desktop
Дата выпуска
December 2017
Название модели
P104 100
Поколение
Mining GPUs
Базоввая частота
1607MHz
Boost Частота
1733MHz
Интерфейс шины
PCIe 3.0 x16
Транзисторы
7,200 million
TMU
?
Блоки наложения текстур (TMU) служат компонентами графического процессора, которые способны вращать, масштабировать и искажать двоичные изображения, а затем размещать их в виде текстур на любой плоскости заданной трехмерной модели. Этот процесс называется отображением текстур.
120
Производитель
TSMC
Размер процесса
16 nm
Архитектура
Pascal

Характеристики памяти

Объем памяти
4GB
Тип памяти
GDDR5X
Шина памяти
?
Ширина шины памяти обозначает количество бит данных, которые видеопамять может передать за один такт. Чем больше ширина шины, тем больший объем данных может быть передан мгновенно, что делает ее одним из важнейших параметров видеопамяти. Пропускная способность памяти рассчитывается как: Пропускная способность памяти = Частота памяти x Ширина шины памяти / 8. Следовательно, если частоты памяти одинаковы, ширина шины памяти будет определять размер пропускной способности памяти.
256bit
Частота памяти
1251MHz
Пропускная способность
?
Пропускная способность памяти — это скорость передачи данных между графическим чипом и видеопамятью. Он измеряется в байтах в секунду, и формула для его расчета: пропускная способность памяти = рабочая частота × ширина шины памяти / 8 бит.
320.3 GB/s

Теоретическая производительность

Пиксельный филлрейт
?
Скорость заполнения пикселей — это количество пикселей, которые графический процессор (GPU) может визуализировать в секунду, измеряется в мегапикселях/с (миллион пикселей в секунду) или GPixels/s (миллиард пикселей в секунду). Это наиболее часто используемый показатель для оценки производительности обработки пикселей видеокарты.
110.9 GPixel/s
Текстурный филлрейт
?
Скорость заполнения текстуры — это количество элементов карты текстур (текселей), которые графический процессор может сопоставить с пикселями за одну секунду.
208.0 GTexel/s
FP16 (half)
?
Важным показателем для измерения производительности графического процессора являются возможности вычислений с плавающей запятой. Числа с плавающей запятой половинной точности (16 бит) используются в таких приложениях, как машинное обучение, где допустима более низкая точность. Числа с плавающей запятой одинарной точности (32-битные) используются для обычных задач обработки мультимедиа и графики, а числа с плавающей запятой двойной точности (64-битные) необходимы для научных вычислений, требующих широкого числового диапазона и высокой точности.
104.0 GFLOPS
FP64 (double)
?
Важным показателем для измерения производительности графического процессора являются возможности вычислений с плавающей запятой. Числа с плавающей запятой двойной точности (64-битные) необходимы для научных вычислений, требующих широкого числового диапазона и высокой точности, а числа с плавающей запятой одинарной точности (32-битные) используются для обычных задач обработки мультимедиа и графики. Числа с плавающей запятой половинной точности (16 бит) используются в таких приложениях, как машинное обучение, где допустима более низкая точность.
208.0 GFLOPS
FP32 (float)
?
Важным показателем для измерения производительности графического процессора являются возможности вычислений с плавающей запятой. Числа с плавающей запятой одинарной точности (32-битные) используются для обычных задач обработки мультимедиа и графики, а числа с плавающей запятой двойной точности (64-битные) необходимы для научных вычислений, требующих широкого числового диапазона и высокой точности. Числа с плавающей запятой половинной точности (16 бит) используются в таких приложениях, как машинное обучение, где допустима более низкая точность.
6.522 TFLOPS

Другое

Потоковый мультипроцессор (SM)
?
Несколько потоковых процессоров (SP) вместе с другими ресурсами образуют потоковый мультипроцессор (SM), который также называется основным ядром графического процессора. Эти дополнительные ресурсы включают в себя такие компоненты, как планировщики деформации, регистры и общую память. SM можно считать сердцем графического процессора, аналогично ядру ЦП, при этом регистры и общая память являются дефицитными ресурсами внутри SM.
15
Блоки шейдинга
?
Самым фундаментальным процессором является потоковый процессор (SP), в котором выполняются определенные инструкции и задачи. Графические процессоры выполняют параллельные вычисления, что означает, что несколько процессоров SP работают одновременно для обработки задач.
1920
Кэш L1
48 KB (per SM)
Кэш L2
2MB
TDP
130W
Версия Vulkan
?
Vulkan — это кроссплатформенный графический и вычислительный API от Khronos Group, предлагающий высокую производительность и низкую нагрузку на процессор. Он позволяет разработчикам напрямую управлять графическим процессором, снижает затраты на рендеринг и поддерживает многопоточные и многоядерные процессоры.
1.3
Версия OpenCL
3.0
OpenGL
4.6
DirectX
12 (12_1)
CUDA
6.1
Разъемы питания
1x 8-pin
Шейдерная модель
6.4
ROP
?
Конвейер растровых операций (ROP) в первую очередь отвечает за расчеты освещения и отражений в играх, а также за управление такими эффектами, как сглаживание (AA), высокое разрешение, дым и огонь. Чем более требовательны к сглаживанию и световым эффектам в игре, тем выше требования к производительности для ROP; в противном случае это может привести к резкому падению частоты кадров.
64
Требуемый блок питания
200W

Бенчмарки

FP32 (float)
6.522 TFLOPS
Blender
612
OctaneBench
122
Vulkan
45859
OpenCL
52079

По сравнению с другими GPU

FP32 (float) / TFLOPS
6.977 +7%
6.61 +1.3%
6.522
6.181 -5.2%
Blender
1224.91 +100.1%
612
335 -45.3%
126 -79.4%
OctaneBench
515 +322.1%
122
67 -45.1%
35 -71.3%
Vulkan
101318 +120.9%
72046 +57.1%
45859
20775 -54.7%
8986 -80.4%
OpenCL
103572 +98.9%
72374 +39%
52079
30631 -41.2%
15023 -71.2%