Таблица производительности видеокарт для майнинга 2020: Выбор лучшей видеокарты для майнинга 2021, таблица и рейтинг

Содержание

Майнинг на видеокарте GPU – полное руководство

Сегодня особенно активно обсуждается майнинг криптовалюты, и многие пользователи интересуются, с чего начать добычу монет и как это вообще происходит. Популярность этой индустрии уже оказала ощутимое влияние на рынок графических процессоров и мощная видеокарта у многих уже давно ассоциируется не с требовательными играми, а с криптофермами. В этой статье мы расскажем, как организовать весь процесс с нуля и начать майнить на собственной ферме, что для этого использовать и почему невозможен майнинг на видеокарте ноутбука.

Что такое майнинг на видеокарте

Майнинг на видеокарте – это процесс добычи криптовалюты с помощью графических процессоров (GPU). Для этого используют мощную видеокарту в домашнем компьютере или специально собранную ферму из нескольких устройств в одной системе. Если вас интересует, почему для этого процесса используются именно GPU, то ответ весьма прост. Всё дело в том, что видеокарты изначально разрабатываются для обработки большого количества данных путём произведения однотипных операций, как в случае с обработкой видео.

Такая же картина наблюдается и в майнинге криптовалюты, ведь тут процесс хэширования столь же однотипен.

Для майнинга используются полноценные дискретные видеокарты. Ноутбуки или интегрированные в процессор чипы не используются. В сети также встречаются статьи про майнинг на внешней видеокарте, но это также работает не во всех случаях и является не лучшим решением.

Какие видеокарты подойдут для майнинга

Итак, что касается выбора видеокарты, то здесь обычная практикая – приобретение AMD rx 470, rx 480, rx 570, rx 580 или Нвидиа 1060, 1070, 1080 ti. Также подойдут – но не принесут большой прибыли – видеокарты типа r9 280x, r9 290, 1050, 1060. Совершенно точно не принесёт прибыли майнинг на слабой видеокарте вроде geforce gtx 460, gts 450, gtx 550ti. Если говорить о памяти, то брать лучше от 2 гб. Может оказаться недостаточно даже 1 гб, не говоря уже о 512 мб. Если говорить про майнинг на профессиональной видеокарте, то приносит он примерно столько же, сколько и обычные, или даже меньше.

С учётом стоимости таких ВК – это невыгодно, но добывать с их помощью можно, если они уже есть у вас в наличии.

Стоит также отметить, что все видеокарты могут получить прирост производительности благодаря разблокировке значений, которые заложил производитель. Такой процесс называется разгон. Однако это небезопасно, приводит к потере гарантии и карта может выйти из строя, например, начав показывать артефакты. Разгонять видеокарты можно, но нужно ознакомиться с материалами по данной теме и действовать с осторожностью. Не стоит пытаться сразу установить все значения на максимум, а ещё лучше – поищите в интернете примеры удачных настроек разгона именно для вашей видеокарты.

Самые популярные видеокарты для майнинга 2021

Ниже приведено сравнение видеокарт. Таблица содержит хешрейт самых популярных устройств и их максимальное энергопотребление. Нужно сказать, что эти показатели могут варьироваться, в зависимости от конкретной модели видеокарты, её производителя, используемой памяти и некоторых других характеристик.

Писать об устаревших показателях, таких как майнинг лайткоин на видеокарте, нет смысла, поэтому рассматриваются только три самых популярных алгоритма для ферм на видеокартах.

Видеокарта Ethash Equihash CryptoNight Энергопотребление
AMD Radeon R9 280x 11 MH/s 290 H/s 490 H/s 230W
AMD Radeon RX 470 26 MH/s 260 H/s 660 H/s 120W
AMD Radeon RX 480 29.5 MH/s 290 H/s 730 H/s 135W
AMD Radeon RX 570 27.9 MH/s 260 H/s 700 H/s 120W
AMD Radeon RX 580 30.2 MH/s 290 H/s 690 H/s 135W
Nvidia GeForce GTX 750 TI 0.5 MH/s 75 H/s 250 H/s 55W
Nvidia GeForce GTX 1050 TI 13.9 MH/s 180 H/s 300 H/s 75W
Nvidia GeForce GTX 1060 22. 5 MH/s 270 H/s 430 H/s 90W
Nvidia GeForce GTX 1070 30 MH/s 430 H/s 630 H/s 120W
Nvidia GeForce GTX 1070 TI 30.5 MH/s 470 H/s 630 H/s 135W
Nvidia GeForce GTX 1080 23.3 MH/s 550 H/s 580 H/s 140W
Nvidia GeForce GTX 1080 TI 35 MH/s 685 H/s 830 H/s 190W

Возможен ли майнинг на одной видеокарте?

Если у вас нет желания собирать полноценную ферму из множества GPU или вы просто хотите опробовать этот процесс на домашнем компьютере, то можно майнить и одной видеокартой. Никаких отличий нет и вообще количество устройств в системе не важно. Более того, вы можете установить устройства с разными чипами или даже от разных производителей. Потребуется лишь запустить параллельно две программы для чипов разных компаний. Напомним ещё раз, что майнинг на интегрированной видеокарте не производится.

Какие криптовалюты можно майнить на видеокартах

Майнить на GPU можно любую криптовалюту, но следует понимать, что производительность на разных алгоритмах будет отличаться на одной и той же карточке. Более старые алгоритмы уже плохо подходят для видеопроцессоров и не принесут никакой прибыли. Происходит это из-за появления на рынке новых устройств – так называемых ASIC-майнеров. Они куда более производительные и значительно повышают сложность сети, однако их стоимость высока и исчисляется тысячами долларов. Поэтому добыча монет на SHA-256 (Биткоин) или Scrypt (Litecoin, Dogecoin) в домашних условиях – это не лучшая идея.

Кроме LTC и DOGE, ASICи сделали невозможной добычу Bitcoin (BTC), Dash и других валют. Куда лучшим выбором станут криптовалюты, которые используют защищенные от ASIC-ов алгоритмы. Так, например, с помощью GPU получится добывать монеты на алгоритмах CryptoNight (Карбованец, Монеро, Electroneum, Bytecoin), Equihash (ZCash, Hush, Bitcoin Gold) и Ethash (Ethereum, Ethereum Classic). Список далеко не полный и постоянно появляются новые проекты на этих алгоритмах. Среди них встречаются как форки более популярных монет, так и совершенно новые разработки. Изредка даже появляются новые алгоритмы, которые предназначены для решения определённых задач и могут использовать различное оборудование. Ниже будет рассказано о том, как узнать хешрейт видеокарты.

Смотрите также: полный список криптовалют.

Что нужно для майнинга на видеокарте

Ниже приведён список того, что вам понадобится для создания фермы:

  • Видеокарты. Выбор конкретных моделей зависит от вашего бюджета или того, что уже имеется в наличии. Конечно, старые устройства на AGP не подойдут, но можно использовать любую карту среднего или топового класса последних годов. Выше вы можете вернуться к таблице производительности видеокарт, которая позволит сделать подходящий выбор.
  • Компьютер для их установки. Необязательно использовать топовое железо и делать ферму на базе высокопроизводительных комплектующих. Достаточно будет какого-нибудь старого AMD Athlon, нескольких гигабайт оперативной памяти и жесткого диска для установки операционной системы и нужных программ. Важна также материнская плата. Она должна иметь достаточное для вашей фермы количество PCI-слотов. Существуют специальные версии для майнеров, которые содержат 6-8 слотов, и в определённых случаях выгодней использовать их, чем собирать несколько ПК. Особое внимание стоит уделять лишь блоку питания, ведь система будет работать под высокой нагрузкой круглые сутки. Брать БП нужно обязательно с запасом мощности и желательно наличие сертификатов 80 Plus. Возможно также соединение двух блоков в один с помощью специальных переходников, но такое решение вызывает в интернете споры. Корпус лучше не использовать вовсе. Для лучшего охлаждения рекомендуется сделать или купить специальный стенд. Видеокарты в таком случае выносятся с помощью специальных переходников, которые называются райзеры. Приобрести их можно в профильных магазинах или на «Алиэкспресс».
  • Хорошо проветриваемое сухое помещение. Размещать ферму стоит в нежилой комнате, а лучше вообще в отдельном помещении. Это позволит избавиться от дискомфорта, который возникает из-за шумной работы систем охлаждения и теплоотдачи. Если такой возможности нет, то следует выбирать видеокарты с максимально тихой системой охлаждения. Узнать о ней подробней вы сможете из обзоров в интернете, например, на YouTube. Следует также подумать о циркуляции воздуха и вентилируемости, чтобы максимально снизить температуру.
  • Программа майнер. GPU-майнинг происходит с помощью специального программного обеспечения, которое может быть найдено в интернете. Для производителей ATI Radeon и Nvidia используется разный софт. Это же касается и разных алгоритмов.
  • Обслуживание оборудования. Это очень важный пункт, так как не все понимают, что майнинг-ферма требует постоянного ухода. Пользователю нужно следить за температурой, менять термопасту и очищать СО от пыли. Следует также помнить о технике безопасности и регулярно проверять исправность системы.

Смотрите также: оборудование для майнинга.

Как настроить майнинг на видеокарте с нуля

В данном разделе нами будет рассмотрен весь процесс добычи от выбора валюты до вывода средств. Следует отметить, что весь этот процесс может несколько отличаться для различных пулов, программ и чипов.

Как выбрать видеокарту для майнинга

Мы рекомендуем вам ознакомиться с таблицей, которая представлена выше и с разделом о подсчёте потенциального заработка. Это позволит рассчитать примерный доход и определиться с тем, какое железо вам больше по карману, а также разобраться со сроками окупаемости вложений. Не стоит также забывать о совместимости разъёмов питания видеокарты и блока питания. Если используются разные, то следует заранее обзавестись соответствующими переходниками. Всё это легко покупается в китайских интернет-магазинах или у местных продавцов с некоторой наценкой.

Выбираем криптовалюту

Теперь важно определиться с тем, какая монета вас интересует и каких целей вы хотите достичь. Если вас интересует заработок в реальном времени, то стоит выбирать валюты с наибольшим профитом на данный момент и продавать их сразу после получения. Можно также майнить самые популярные монеты и держать их до тех пор, пока не произойдёт скачок цены. Есть также своего рода стратегический подход, когда выбирается малоизвестная, но перспективная, на ваш взгляд, валюта – и вы вкладываете мощности в неё, в надежде, что в будущем стоимость значительно возрастёт.

Выбираем пул для майнинга

Пулы для майнинга также имеют некоторые отличия. Некоторые из них требуют регистрации, а некоторым достаточно лишь адреса вашего кошелька для начала работы. Первые обычно хранят заработанные вами средства до достижения минимальной для выплаты суммы, либо в ожидании вывода вами денег в ручном режиме. Хорошим примером такого пула является Suprnova.cc. Там предлагается множество криптовалют и для работы в каждом из пулов достаточно лишь раз зарегистрироваться на сайте. Сервис прост в настройке и хорошо подойдёт новичкам.

Подобную упрощённую систему предлагает и сайт Minergate. А если вы не хотите регистрироваться на каком-то сайте и хранить там заработанные средства, то вам следует выбрать пул в официальной теме интересующей вас монеты на форуме BitcoinTalk. Простые пулы требуют лишь указания адреса для начисления крипты и в дальнейшем с помощью адреса можно будет узнавать статистику добычи.

Создаем криптовалютный кошелек

Данный пункт не нужен вам, если используете пул, который требует регистрацию и имеет встроенный кошелёк. Если же вы хотите получать выплаты автоматически себе на кошелёк, то почитайте о создании кошелька в статье о соответствующей монете. Данный процесс может существенно отличаться для разных проектов.

Можно также просто указывать адрес вашего кошелька на какой-то из бирж, но следует отметить, что не все обменные платформы принимают транзакции с пулов. Наилучшим вариантом будет создание кошелька непосредственно на вашем компьютере, но если вы работаете с большим количеством валют, то хранение всех блокчейнов будет неудобно. В таком случае стоит поискать надёжные онлайн-кошельки, либо облегчённые версии, которые не требуют загрузки всей цепи блоков.

Выбираем и устанавливаем программу для майнинга

Выбор программы для добычи крипты зависит от выбранной монеты и её алгоритма. Наверное все разработчики такого ПО имеют темы на BitcoinTalks, где можно найти ссылки на скачивание и информацию о том, как происходят настройка и запуск. Почти все эти программы имеют версии как для Виндовс, так и для Линукс. Большинство таких майнеров бесплатные, но некоторый процент времени они используют для подключения к пулу разработчика. Это своего рода комиссия за использование программного обеспечения. В некоторых случаях её можно отключить, но это приводит к ограничениям функционала.

Настройка программы заключается в том, что вы указываете пул для майнинга, адрес кошелька или логин, пароль (если есть) и другие опции. Рекомендуется, например, выставлять максимальный лимит температуры, при достижении которого ферма отключится, чтобы не вредить видеокартам. Регулируется скорость вентиляторов системы охлаждения и проводятся другие более тонкие настройки, которые вряд ли будут использоваться новичками.

Если вы не знаете, какое ПО выбрать, посмотрите наш материал, посвященный программам для майнинга, либо изучите инструкции на сайте пула. Обычно там есть раздел, который посвящён началу работы. Он содержит перечень программ, которые можно использовать, и конфигурации для .bat файлов. С его помощью можно быстро разобраться с настройкой и начать майнинг на дискретной видеокарте. Можно сразу создать батники для всех валют, с которыми вы хотите работать, чтобы в дальнейшем было удобнее переключаться между ними.

Запускаем майнинг и следим за статистикой

После запуска .bat файла с настройками вы увидите консольное окно, куда будет выводиться лог происходящего. Его также можно будет найти в папке с запускаемым файлом. В консоли вы можете ознакомиться с текущими показателем хешрейта и температурой карты. Вызывать актуальные данные обычно позволяют горячие клавиши.

Вы также сможете увидеть, если устройство не находит хэши. В таком случае будет выведено предупреждение. Случается это, когда что-то настроено неправильно, выбрано неподходящее для монеты программное обеспечение или ГПУ не функционирует должным образом. Многие майнеры также используют средства для удалённого доступа к ПК, чтобы следить за работой фермы, когда они находятся не там, где она установлена.

Выводим криптовалюту

Если вы используете пулы вроде Suprnova, то все средства просто накапливаются на вашем аккаунте и вы можете вывести их в любой момент. Остальные пулы чаще всего используют систему, когда средства начисляются автоматически на указанный кошелёк после получения минимальной суммы вывода. Узнать о том, сколько вы заработали, обычно можно на сайте пула. Требуется лишь указать адрес вашего кошелька или залогиниться в личный кабинет.

Сколько можно заработать?

Сумма, которую вы можете заработать, зависит от ситуации на рынке и, конечно, общего хешрейта вашей фермы. Важно также то, какую стратегию вы выберите. Необязательно продавать всё добытое сразу. Можно, например, подождать скачка курса намайненной монеты и получить в разы больше профита. Однако всё не так однозначно и предугадать дальнейшее развитие событий бывает просто нереально.

Окупаемость видеокарт

Подсчитать окупаемость поможет специальный онлайн-калькулятор. В интернете их много, но мы рассмотрим этот процесс на примере сервиса WhatToMine. Он позволяет получать данные о текущем профите, основываясь на данных вашей фермы. Нужно только выбрать видеокарты, которые есть у вас в наличии, а потом добавить стоимость электроэнергии в вашем регионе. Сайт посчитает сколько вы можете заработать за сутки.

Следует понимать, что учитывается лишь текущее положение дел на рынке и ситуация может измениться в любой момент. Курс может упасть или подняться, сложность майнинга станет другой или появятся новые проекты. Так, например, может прекратиться добыча эфира, в связи с возможным переходом сети на PoS. Если прекратиться майнинг эфириума, то фермам нужно будет куда-то направить свободные мощности, например, в майнинг ZCash на GPU, что повлияет на курс этой монеты. Подобных сценариев на рынке множество, и важно понимать, что сегодняшняя картина может не сохраниться на протяжении всего срока окупаемости оборудования.

Смотрите также: тарифы на электроэнергию в Украине.

Майнинг на процессоре VS майнинг на видеокарте

Видеокарты, как уже писалось выше, больше подходят для добычи криптовалюты, чем процессоры. Однако некоторые CPU всё же показывают неплохие результаты, например, последние чипы от AMD. Более того, если у вас в системе установлено мощное железо, то возможен и одновременный майнинг на процессоре и видеокарте. Никаких проблем это не вызывает: нужно лишь запустить два отдельных процесса на компьютере.

Так, например, на CPU хорошо добываются монеты с алгоритмом CryptoNight, такие как Monero (XMR), или можно запустить майнинг Bytecoin (BCN) на видеокарте и процессоре. Следует только помнить о том, что процессору также требуется хорошая система охлаждения и компоненты не должны перегреваться друг от друга. Особенно это актуально в тех случаях, когда всё оборудование установлено в стандартный корпус ПК.

Заключение

В заключение следует сказать, что майнинг – это интересное вложение, которое позволит не только заработать, но и помочь развитию индустрии криптовалют, благодаря поддержке сети. Конечно, сейчас это не так выгодно, как было в первой половине 2017 года, да и майнинг биткоинов на видеокарте уже давно невозможен, но в будущем всё может снова поменяться.

Конечно, не все хотят заниматься обслуживанием железа и возиться с ним, но находятся люди, которым интересен сам процесс. Также необходимы вложения, ведь майнинг на встроенной видеокарте Intel невозможен, как и использование старых чипов. Надеемся, что наша таблица, которая содержит рейтинг видеокарт для майнинга по хешрейту, сможет помочь вам в подборе оборудования, и вы смогли узнать из данной статьи о том, что это за процесс.

Лучшая видеокарта для майнеров? Nvidia CMP 220HX при производительности 210 MH/s будет стоить всего 3000 долларов

В Сети появились новые подробности о «самой мощной видеокарте для майнеров». Напомним, по слухам, такую готовит Nvidia — на базе GPU Ampere A100, который используется в ускорителе Nvidia A100 для PCIe для центров обработки данных. Вчера мы приводили расчёт, который говорил о низкой экономической эффективности «монстра майнинга» Nvidia при стоимости такой же, как у Nvidia A100 для PCIe. А это, на минуточку, 11 000 долларов! В таком случае майнерам проще купить 3–4 GeForce RTX 3090 и получить даже большую производительность. Но новые подробности о перспективной новинке делают «монстра майнинга» намного привлекательнее — настолько, что после выпуска этой видеокарты майнеры могут перейти на неё целиком, оставив, наконец-то, GeForce RTX 3090 геймерам.

Само собой, привлекательной видеокарту может сделать только сочетание высокой производительности в майнинге и относительно низкой цены. И в этом плане перспективная новинка определённо порадует: при хешрейте 210 MH/s цена составит всего 3000 долларов. Для сравнения, столько же сейчас в среднем стоит GeForce RTX 3090 со вдвое меньшей производительностью. По предварительным данным, «монстр майнинга» Nvidia будет называться CMP 220HX, а её базисом действительно послужит GPU A100. За счёт чего компания снизит стоимость с 11 000 до 3000 долларов при сохранении того же графического процессора — пока непонятно.

Неизвестны и сроки официального анонса и старта продаж CMP 220HX. Во втором квартале майнерам станут доступны модели CMP 50HX с производительностью 45 MH/s (это уровень разблокированной GeForce RTX 3060 или GeForce RTX 3060 Ti) и CMP 90HX с производительностью 86 MH/s (как у GeForce RTX 3080). Судя по всему, CMP 220HX будет запущена в производство никак не раньше третьего квартала текущего года. Так что на появление её в продаже можно рассчитывать лишь к осени. А до тех пор на снижение стоимости GeForce RTX 3090 надеяться не стоит.  

ОНЛАЙН КАЛЬКУЛЯТОР ПРИБЫЛЬНОСТИ ОБОРУДОВАНИЯ ДЛЯ МАЙНИНГА

Выбирите энергопотребление:

Майнинг как мейнстримное направление бизнеса

Цифровые активы привлекают все больше инвесторов. Принцип децентрализации, положенный в основу выпуска и учета криптомонет, гарантирует им высокую степень защищенности.

Неудивительно, что майнинг виртуальных валют выходит на передовые бизнес-рубежи. Современная электронная индустрия наполнила рынок различными видами криптодобывающего оборудования. По способу организации выделяют:

“асики” — вычислительные устройства, по мощности многократно превосходящие обычные PC; в разработках ASIC-майнеров используются сложнейшие интегральные схемы, приспособленные к расшифровке замысловатых криптографических алгоритмов;

GPU-фермы, работа которых базируется на процессорах или видеокартах.

Если поначалу эти устройства добывали только Биткоины, то с развитием майнинг-отрасли им стали доступны самые разные альткоины. В последнее время появились дуал-майнеры, приносящие владельцам сразу две валюты.

Проблема выбора криптодобывающего устройства

На современном рынке майнинг-оборудования существует жесткая конкуренция. Высокопроизводительные ASIC-майнеры теснят фермы на видеокартах. Однако те не сдаются, имея несколько преимуществ:

адаптивность к добыче любой валюты;

возможность приобретения видеокарт в обычном магазине;

упрощенность ремонта.

Несмотря на эти “плюсы”, внимание потребителей к сверхмощным и суперумным ASIC-майнерам неуклонно растет. Специфичность “асиков” и связанные с этим риски останавливают все меньше ценителей электронного капитала. В таких условиях вопрос правильного выбора криптодобывающего устройства становится все более  актуальным.

Незаменимым помощником в этом деле станет калькулятор прибыльности майнинг-добычи. Поскольку любой “копатель” в процессе работы претерпевает постоянные нагрузки, необходимо, чтобы до истечения гарантийного срока он окупил себя и принес прибыль. В противном случае пользователь останется в “минусе”. Поэтому так важно все точно предварительно рассчитать.

Что может майнинг-калькулятор?

Приобретателю криптодобывающей машины важно заранее рассчитать ее рентабельность, исходя из главных технических параметров — мощности и энергоэффективности. Не каждый человек может справиться с подобными расчетами. Они требуют определенной квалификации и могут отнять уйму времени. Неоценимую помощь в этом деле окажет всезнающий и всеумеющий автоэксперт — онлайн-калькулятор доходности майнинга.

Его программа снабжена всеми необходимыми параметрами, что позволяет ему легко справляться с трудоемкими математическими подсчетами. При этом он учитывает множество переменных, влияющих на доходность майнинга и определяющих ее прогноз:

возрастающую сложность добычи;

непредсказуемую стоимость цифровых активов;

незапланированные накладные расходы, включающие в себя не только траты на электроэнергию, но и сервисное обслуживание электронного оборудования.

Довольно сложно, даже для специалиста, правильно произвести расчеты с учетом этой меняющейся (иногда за считанные часы) информации. А ведь игнорирование любой из приведенных переменных может стать ключевым фактором бизнес-краха.

Майнинг-калькулятор — программа, важнейшая информация которой постоянно обновляется. Сложность добычи для всех монет актуализируется ежедневно. Стоимость активов уточняется каждые 10 минут. Для удобного ориентирования пользователей в сводную таблицу занесены все ведущие модели добывающего оборудования с параметрами производительности и энергопотребления для каждого алгоритма.  

Такой функционал поможет быстро и безошибочно определить выгодность конкретного устройства. Более того, уникальный инструмент позволит сопоставить несколько разновидностей востребованного оборудования и сделать обоснованный выбор между ними.

Точные и мгновенные расчеты калькулятора прибыльности не позволят потерпеть убытки ни стартапу, ни серьезному предприятию с многолетним опытом. Круглосуточный интерактивный онлайн-помощник вооружит каждого пользователя разумным планом действий, что критически важно для развития бизнеса по добыче электронных активов.

Как пользоваться калькулятором?

Продуманный опытными программистами функционал онлайн-калькулятора достаточно прост в обращении. Воспользоваться им с первого раза сможет даже начинающий майнер. Ход действий рекомендуется следующий:

Выберите из представленного списка топовых майнинг-устройств интересующий вас девайс.

Оцените главные технические характеристики выбранного оборудования: хэшрейт (скорость вычисления в секунду) и энергопотребление (расходы электричества в течение часа работы).

Обратите внимание на коэффициент чистой дневной прибыли (в долларах), полученной путем вычитания энергозатрат из общего дохода.

По цвету поля, где указана дневная выручка, вы сможете мигом установить место майнера или ГПУ-фермы в рейтинге аналогичных товаров:

зеленый — от 15$ и более в день;

салатовый —  от 10$ до 15$ в день;

желтый — от 5$ до 10$ в день;

темно-оранжевый — от 0$ до 5$ в день;

темно-красный — работает в минус при платной розетке.

Чтобы сопоставить по выгодности несколько девайсов, достаточно нажать кнопку “Сравнить”. Те, кого интересует вид добываемой валюты, могут воспользоваться опцией “Выберите алгоритм” (в самом верху страницы “Калькулятор”).

На сайте представлены самые “ходовые” алгоритмы:

SHA-256 — разработанный в 2002 году алгоритм-первопроходец, “заточенный” на добычу Bitcoin; на нем можно также “копать” более ста других монет, в частности BitcoinDark, BetaCoin, Bitcoin Cash, Peercoin, Syscoin, Namecoin, Universel, DGB-SHA;

Scrypt —  алгоритм, появившийся после SHA-256 и усложненный увеличенным объемом памяти; помимо “цифрового серебра”, то есть Litecoin, на Scrypt майнят Dogecoin, Gulden Bitdeal, DNotes, B3Coin, Florin, Aur-Scrypt, DGB-Scrypt;

Equihash — популярный алгоритм нового поколения, еще более усложненный и защищенный, чем Scrypt; позволяет хэшировать BitcoinGold, Zencash, Zclassic, Komodo, Zcash, Hush;

X11 — продвинутый алгоритм, разработанный с цепочкой в 11 хэш-функций и впервые апробированный в 2014 году с криптомонетой Darkcoin, впоследствии переименованной в Dash; кроме нее, на нем добывают Quark, Onix, Pura, Cannabiscoin, Monoeci, Prime-XI;

CryptoNight — хорошо проработанный алгоритм, создатели которого каждые полгода вносят в него изменения; главная монета — Monero, кроме нее добывают Karbo, Bytecoin, Dynastycoin, Sumokoin, Electroneum.

Под каждый алгоритм выбраны 10 популярных валют, и по самой профитной выдается результат.

Помимо общих данных, наш калькулятор предоставит майнеру графические изображения, по которым можно судить о прибыли за 24 часа, 7 дней, месяц (с учетом расхода и региональной стоимости электроэнергии).

Чтобы получить указанную информацию, нужно кликнуть на заинтересовавший продукт и перейти таким образом на его карточку. В графе “Стоимости электричества” следует выбрать (или ввести) свой местный тариф и нажать кнопку “Применить”.

Преимущества нашего онлайн-калькулятора

Интуитивный интерфейс калькулятора криптовалют максимально упростит и облегчит  выбор нужного товара. С помощью электронного помощника длительный и трудоемкий процесс подсчета пользователю не грозит. Со всеми его проблемами вмиг управится компетентная и автоматически действующая программа.

А самый приятный бонус заключается в том, что все майнинговые машины, указанные в списке онлайн-калькулятора, входят в ассортимент нашего интернет-магазина. Это позволит перейти от быстрого расчета к немедленной покупке товара.

Концепция нашего калькулятора позволит вам найти как самое выгодное на данный момент оборудование, так и любое другое. У вас есть шанс узнать, сколько сейчас монет приносит девайс и сколько он добывал, к примеру, пару дней назад. Все это позволит вам сделать беспроигрышный выбор и в скором времени приступить к продуктивному майнингу.

Как разгонять видеокарты Nvidia и AMD для майнинга на разных алгоритмах

2021 — год массовой популярности криптовалют. Биткоин уже взял уровень 58 тысяч, а монеты поменьше не спят и также устанавливают новые исторические максимумы. Одновременно с этим существенно выросла популярность майнинга. К примеру, если в конце ноября на майнинг-пуле 2Miners криптовалюту добывало 11 тысяч человек, то сейчас их больше 40 тысяч. Если вы также решили присоединиться к добыче монет и делать это с видеокартами Nvidia, данная статья для вас. Рассказываем, как разгонять видеокарты для увеличения прибыли и делать это правильно для разных алгоритмов.

Материал подготовил Трушин Денис, руководитель отдела развития перспективных технологий ООО "АДМ-ТЕХНО".

Майнеры обеспечивают защиту криптовалюты от возможных атак или отмены транзакций. Чем больше майнеров — тем лучше защита сети и сложнее проведение атаки на неё, вплоть до невозможности атаки из-за отсутствия в мире необходимого количества необходимого майнинг-оборудования (атакующий не может найти в аренду такое количество видеокарт, которое обеспечит 50% хешрейта атакуемой сети).
 
За эту работа любая сеть криптовалюты системы PoW (Proof of Work — доказательство работы) платит майнерам своими монетами. Они берутся из выпуска новых монет и комиссионных с транзакций. Когда майнеры находят новый блок в сети криптовалюты, они получают за это награду — полюс комиссию с переводов которые были включены в этот блок.

Какие криптовалюты майнить в 2021 году?

В конце 2020 года и начале 2021 года максимально прибыльной в майнинге монетой был Эфириум. Это также Ethereum, ETH или просто «эфир» на майнерском жаргоне.

Для эффективного майнинга эфира в 2021 году необходима карта с 5 ГБ и больше видеопамяти на видеокарте.

Дефицит видеокарт Nvidia

Те видеокарты, которые уже не могут майнить Эфир, относительно прибыльно майнят Ravencoin RVN, но об этом ниже.

Настройка разгона видеокарт Nvidia и AMD для майнинга Эфира

Если вы не хотите вникать в тонкости настроек, а просто ищите заветные значения то они приведены ниже в наших таблицах. Но мы советуем вам прочитать всю статью и понять, как работает разгон и настройка видеокарт для майнинга. После прочтения вы сможете более точно настроить свои карты и получите выше хешрейт и меньше потребление электричества, что, разумеется, приведет к повышению прибыли. Но если вам надо «быстро», «сразу», «лень вникать» — то используйте наши таблицы. Для настройки разгона видеокарт установите MSI Afterburner, если у вас еще его нет.

Мы выяснили идеальные настройки видеокарт Nvidia и AMD для разгона и собрали их в таблице. В столбцах указаны модели устройств, частота ядра, частота памяти, лимит мощности и ожидаемый хешрейт. Для начала приводим данные для видеокарт Nvidia.

Разгон видеокарт Nvidia

И данные по AMD.

Разгон видеокарт AMD

Решились вникнуть в процесс разгона и настройки видеокарт для майнинга, тогда читайте дальше.

Как разгонять видеокарту при майнинге Эфириума

Важный момент: при разгоне и тестах всегда следите за температурой видеокарты. При безопасном майнинге Эфира температура ядра не должна подниматься выше 65 градусов. Выше температура — на свой страх и риск.

Базовая настройка видеокарт под Эфир достаточно проста.

  1. в первую очередь мы определяем, на какой частоте максимально будет работать память, с шагом +25 МГц. Находим ту, на которой начинает слетать — то есть перезагружаться — драйвер видеокарты, и отступаем от неё 50 МГц вниз в стабильную область.
  2. находим напряжение ядра, при котором нас устраивает энергопотребление карты. Чем ниже напряжение, тем меньше «кушает» карта, но тем ниже максимальная скорость. Зависимость непропорциональная, ведь обычно при убавлении потребления на 20-25% от номинала, скорость падает всего на 10-15%.
  3. находим максимальную стабильную частоту ядра (также по +25 Мгц) и отступаем от неё вниз 25 МГц.

Более тонкая настройка даст нам 2-6% дополнительной скорости или 2-4% энергоэффективности. Мы не будем подробно останавливаться на ней в этой статье.

Майнер криптовалюты

Вышеприведённая инструкция хорошо подходит для видеокарт производителя AMD. Для видеокарт Nvidia настройка высокоэффективного майнинга чуть сложнее, поэтому остановимся отдельно на каждой серии.

Майнинг с Nvidia на Windows (режимы P2 и P0)

Важным моментом при работе с картами Nvidia под управлением Windows является то, что изначально память видеокарт на штатных частотах допускает небольшое число ошибок, которые не критичны при отрисовке изображений в играх, но могут быть критичны при точных расчетах. Поэтому для работы систем CUDA инженеры Nvidia предусмотрели особый режим с пониженной частотой памяти (P2).

Переход карт в этот режим осуществляется автоматически, однако майнеры часто хотят получить максимальный хешрейт и серьёзно повышают частоту памяти до значений +700, +1000 и даже выше. В результате складываются два фактора — понижение частоты режимом P2 и повышение майнером. При этом майнер успешно работает, но при выключении майнера режим P2 переключается обратно, а плюс частоты выставленный вручную остаётся. Это приводит к частотам, которые карты не могут держать и как следствие — вылет драйвера при выключении или перезапуске майнинг-программы.

Майнер Nvidia

Важно: смена P2 на P0 не даёт прироста максимальной скорости, а только увеличивает стабильность при включении/выключении/перезапуске майнера.

Правильнее всего отключить режим P2 для CUDA — это делается через утилиту nvInspector, точнее её подпрограмму nvProfileInspector. Находим параметр CUDA — Force P2 state, выключаем его, потом запускаем майнер.

nvProfile

Ещё один важный момент: параметр Force P2 state восстанавливается при установке в систему любой новой карты Nvidia, не забывайте его перепроверять.

Майнинг эфира на архитектуре Pascal (серия GTX 10xx)

К сожалению, карты серии 10хх не были разработаны специально под майнинг, поэтому в конце 2020 году майнеры серии 10хх столкнулись с некоторым падением скорости при майнинге Эфира. Для сохранения скорости приходилось поднимать энергопотребление, что существенно изменяло энергоэффективность.

Важно: на серии Nvidia GTX 10хх с каждой следующей эпохой Эфириума — а они меняются раз в четыре дня — энергопотребление видеокарт будет чуть-чуть расти вплоть до максимального лимита мощности видеокарты. Ориентировочно через 1.5 года карты начнут упираться в лимит мощности.

Майнер криптовалют

Обратите внимание на то, что Нвидиа решила не обновлять драйвер Nvidia для карт 10хх для системы Windows 7, поэтому на этой системе невозможен эффективный майнинг Эфира на видеокартах 10хх (видеокарты 16хх, 20хх и 30хх уже не имеют этой проблемы). Для майнинга Эфира на серии 10хх используйте Windows 10 или Rave OS.

Разгон майнинга Эфириума на Nvidia GeForce GTX 1060 (6 ГБ), 1070 и 1070ti

Эти карты работают на типе памяти GDDR5, алгоритм разгона для них одинаковый.

  1. Включаем майнер без разгона. Потихоньку поднимаем частоту памяти (по +50 МГц). Находим ту частоту, на которой начинает слетать — перезагружаться — драйвер видеокарты, отступаем от неё 50 МГц вниз в стабильную область.
  2. начинаем по чуть-чуть снижать PL — где-то по 1%. Видеокарта начнёт потреблять меньше, и температура будет снижаться, в какой-то момент скорость начнёт падать. Останавливаемся на 5% падения скорости.
  3. поднимаем по чуть-чуть частоту ядра, находим ту частоту, на которой начинает слетать драйвер видеокарты, и отступаем от неё 25 МГц вниз в стабильную область.

Скорость, потерянная в пункте №2, должна полностью вернуться. Если вернулась не полностью, можно чуть увеличить Power Limit, однако при этом вырастет и энергопотребление карты.

Майнинг Эфириума на Nvidia GeForce GTX 1080 и 1080ti

Карты 1080 и 1080ti имеют высокотайминговую быструю память GDDR5X, которая изначально существенно проигрывала GDDR5 памяти в процессе майнинга Эфира. Однако достаточно быстро была выпущена таблетка ETHlargementPill-r2, снижающая тайминги для этого типа памяти, после чего они стали очень эффективны для Эфира.

Таблетка делает работу памяти менее стабильной и снижает возможный максимум разгона. Для многих ранних ревизий карт модели GTX 1080 (Rev.A) таблетка нестабильна уже на штатных частотах, поэтому для стабильной работы таких карт частоту памяти видеокарты приходится понижать.

Майнер криптовалют

Если даже понижение частоты не привело к стабильной работе программы-майнера, то для таких карт вместо таблетки необходимо использовать мягкий аналог. Это параметр —mt в майнере t-rex, который изменяется от 0 до 6. Чем выше этот параметр тем агрессивнее снижение таймингов — но и ниже стабильность.

После успешной активации таблетки или подбора параметра —mt разгон этих карт аналогичен картам 1060 и 1070.

Майнинг Ethereum на Nvidia GeForce GTX 16хх и 20хх

Эти карты не имеют проблем с размещением в памяти видеокарты больших объёмов данных и при этом имеют очень мощные ядра.

Алгоритм разгона очень прост:

  1. Снижаем PL до минимума.
  2. Потихоньку поднимаем частоту памяти (по +50 МГц). Находим ту частоту, на которой начинает слетать драйвер видеокарты и отступаем от неё 50 МГц вниз в стабильную область.
  3. Проверяем, что повышение PL не приводит к росту хешрейта.

Если повышение PL увеличивает хешрейт — это актуально для некоторых моделей 2080 и 2080ti — то находим, до какого хешрейта можно поднять PL. Затем делаем следующие шаги.

  • Начинаем по чуть-чуть снижать PL — где-то по 1%. В итоге видеокарта начнёт потреблять меньше, и температура будет снижаться, причём в какой-то момент скорость начнёт падать. Останавливаемся на 5% падения скорости.
  • Поднимаем по чуть-чуть частоту ядра, находим ту частоту, на которой начинает слетать драйвер видеокарты и отступаем от неё 25 МГц вниз в стабильную область.

Nvidia GeForce RTX 2070

Скорость, потерянная в пункте №2, должна полностью вернуться. Если вернулась не полностью, можно чуть увеличить Power Limit, но при этом вырастет и энергопотребление карты.

Майнинг ETH на Nvidia GeForce RTX 30хх

Карты 3070, 3080 и 3090 — самые капризные из всех NVIDIA карт по разгону, на них остановимся подробно. Сразу отметим, что разгон 3060 и 3060ti аналогичен разгону 20хх серии.

Майнинг Эфириума на Nvidia GeForce RTX 3070

При разгоне 3070 — как и всех старших карт 30хх серии — важно чувствовать, чего не хватает карте. Карта стабильно даёт 60 MH/s, при разгоне памяти можно стабильно получить 63-64 MH/s. У карты очень мощное ядро, не особо необходимое для майнинга эфира: ему достаточно 700-800 МГц. Поэтому прожорливость карты смело можно и нужно ограничивать.

Разгон 3070 не сложен: в первую очередь разгоняем память до стабильного максимума, потом снижаем PL.

  1. Потихоньку поднимаем частоту памяти (по +50 МГц). Находим ту частоту, на которой начинает слетать драйвер видеокарты, отступаем от неё 50 МГц вниз в стабильную область.
    Итоговая эффективная частота памяти по MSI Afterburner должна составлять 8100-8400 МГц.
  2. Начинаем снижать PL по 1%, видеокарта начнёт потреблять меньше и температура будет снижаться. В какой-то момент скорость начнёт падать, возвращаем назад в плюс пару процентов.

Nvidia GeForce RTX 3070

В какой-то момент при понижении PL частота ядра может начать "прыгать", периодически сваливаясь ниже 1 ГГц и через секунду возвращаясь обратно. Это значит, что карте не хватает лимита мощности.

Этот эффект называется «тротлинг» (от английского глагола «тормозить»). Важный момент: при этом майнеры t-rex и другие могут показывать высокую скорость, но эффективная будет на 4-5 MH/s ниже отображаемой.

При нагреве карты и разгоне вентиляторов необходимо чуть повысить PL, поскольку у карт Nvidia потребление вентиляторов тоже учитывается в PL, и ядру карты может начать не хватать оставшейся энергии. Это связано с тем, что у карт Nvidia потребление вентиляторов тоже учитывается в PL и ядру карты может начать не хватать оставшейся энергии.

Nvidia GeForce RTX 3070

Вывод: Не перезажимайте PL. Нормальное потребление 3070 при майнинге — 130 Ватт на 63 MH/s скорости.

Лучшие результаты можно получить на Windows 7 при фиксации напряжения ядра в районе 713-725 мВ и понижении частоты ядра. На хорошей памяти получаем потребление 121 Вт при 64.6 MH/s скорости. Это t-rex без учета devfee.

Если использовать фиксацию режима в nvidia инспекторе (команда -forcePState:0,0), то можно получить 61 MH/s при потреблении 107 Вт или 570 MH/s на 1кВт мощности. Но в этом случае после перезагрузки придется сначала восстанавливать режим работы, а только потом включать майнинг, иначе драйвер будет циклически слетать. В данном случае экономия 10 Вт с карты нецелесообразна.

Майнинг Эфириума на Nvidia GeForce RTX 3080

При разгоне 3080 — как и всех старших карт 30хх серии — важно чувствовать, чего не хватает карте. У карты 3080 очень мощное ядро, которое избыточно для майнинга эфира, поэтому в первую очередь максимально ограничиваем ядро — без тротлинга — а уж потом разгоняем память.

Разгон на Windows.

  1. Снижаем частоту памяти до минимума. Используя MSI Afterburner, фиксируем напряжение ядра на 750 мВ, сохраняем, проверяем частоту памяти. Она должна быть в районе 7500 МГц.
  2. Начинаем фиксировать напряжения в нижних точках (743 мВ — 725 мВ — 713 мВ — 700 мВ). Ищем точку, при которой частота памяти упадёт до 5000 МГц (режим P3), отступаем от неё выше на 1 шаг. Удостоверяемся, что частота памяти снова выше 7000 МГц.
  3. Снижаем ядро до минимума. Включаем майнинг.
  4. Потихоньку поднимаем частоту памяти по +50 МГц.

Видеокарты Nvidia

Дальше два варианта.

  1. Либо находим ту частоту, на которой начинает слетать драйвер видеокарты, отступаем от неё 50 МГц вниз в стабильную область.

    После этого можно чуть-чуть прибавить ядро и проверить, что скорость от этого не растёт. Если скорость растёт — тогда прибавляем ядро, главное не дойти до следующего варианта.

  2. Находим точку, после которой ядро начинает «скакать» и проваливаться ниже 1 ГГц. Увы, у нас карта со слабым питанием, останавливаемся на этой точке и довольствуемся текущей скоростью выше 90 MH/s.

Майнинг эфира на Nvidia GeForce RTX 3090

Принцип разгона 3090 никак не отличается от 3080, просто надо изначально предполагать, что 3090 ведёт себя как переразогнанная 3080 со слабым питанием.

Мобильный майнер

Разгон видеокарт AMD RX 5ххх и 6ххх для майнинга

Отдельно обсудим разгон новых и весьма эффективных серий от производителя AMD. В отличие от карт NVidia, у этих карт нет специальных режимов или «умных режимов» работы, жестко прописанных в BIOS видеокарты.

Поэтому использование Windows ни коим образом не помогает добиться лучших результатов по скорости, а даже наоборот — снижает стабильность. Неудивительно, что подавляющее число «красных» майнеров (по цвету логотипа AMD) предпочитают более стабильные готовые системы на базе OS Linux, хорошим примером которых является Rave OS.

С использованием таких систем разгон карт очень прост:

  1. Разгоняем память на 900+ МГц
  2. ставим ядро на 1350-1375 МГц
  3. аккуратно с шагом 5 снижаем вольтаж ядра, пока оно стабильно (до 800 мВ смело, ниже в зависимости от карты)
  4. снижаем вольтаж памяти (до 800 смело, ниже проверяем стабильность)

В итоге получаем максимальный хешрейт при минимальном энергопотреблении.

Вот рекомендация по разгону AMD RX 5600 от пользователя этой видеокарты.

Ядро от 1100 до 1200, по памяти — от 950 — понижаем, пока карта не станет стабильно работать, то есть вплоть до 900 с шагом по 5. Можно их сильнее по вольтажу попробовать загнать до 740 по ядру и памяти, но у меня около 18 дней работало без сбросов с этими настройками, для меня важна стабильность.

AMD RX 5600

Вот результаты по RX 5600.

Хешрейт AMD RX 5600

В отношении AMD RX 5700: ядро можно ставить 1300-1325-1350-1375, по памяти от 930 и понижаем по 5. Если не стабильно работают — тогда вплоть до 900. Вольтаж по 780.

AMD RX 5700

И итог по RX 5700.

Хешрейт AMD RX 5700

Для наглядности показываем реальное энергопотребление упомянутых видеокарт. Слева — результат RX 5600, справа RX 5700.

Энергопотребление RX 5600 и RX 5700

Майнинг Nvidia на алгоритме Kawpow

Алгоритм Kawpow, основной валютой на котором является RVN, достаточно ярко ворвался в майнинг. Для иллюстрации роста популярности криптовалюты приводим график хешрейта Ravencoin на пуле 2Miners: за месяц показатель вырос приблизительно в пять раз.

Хешрейт пула Ravencoin на 2Miners

В то же время курс RVN прыгнул более чем на 500 процентов за тридцать дней. 20 февраля 2021 года он установил рекорд на уровне 28.5 цента.

График курса Ravencoin за месяц

Алгоритм до сих пор работает даже с видеокартами с 3 ГБ памяти, он не капризный (причём многие капризные карты на других алгоритмах уверенно работают на kawpow), а скорость неплохо коррелирует с уровнем PL карт. Наконец, монета RVN есть на многих крупных биржах.

По совокупности факторов — этот алгоритм уверенно занимает второе место по значимости и доходности после Ethash для майнинга на видеокартах.

Майнер Ravencoin

Для cистемы Windows 10 - необходимы видеокарты с 4 ГБ и больше памяти. Для cистемы Windows 7 и Rave OS пока достаточно 3 ГБ памяти на карте.

Разгон видеокарт для алгоритма Kawpow

Настройка видеокарт карт под KAWPOW достаточно проста.

  1. в первую очередь мы определяем, на какой частоте максимально будет работать память, с шагом +25 МГц. Находим ту, на которой начинает слетать драйвер видеокарты, и отступаем от неё 50 МГц вниз в стабильную область.
  2. находим напряжение ядра при котором нас устраивает энергопотребление карты. Чем ниже напряжение, тем меньше «кушает» карта, при этом тем ниже максимальная скорость. Зависимость непропорциональная, обычно при убавлении потребления на 25-35% от номинала скорость падает всего на 15-20%. Это даёт нам уникальные возможности автоматического разгона видеокарт по времени для многотарифных счетчиков.
  3. находим максимальную стабильную частоту ядра — также вверх по +25 Мгц — и отступаем от неё вниз 25 МГц.

Майнеры криптовалют

Более тонкая настройка даст нам 2-6% дополнительной скорости или 2-4% энергоэффективности. Поэтому мы не будем на ней подробно останавливаться в этой статье.

За всеми секретами заходите к нам в Телеграм-чат.

Энергоэффективность в майнинге и её значимость. Выбор режима работы

Все видеокарты могут работать в экономичном режиме, однако их также можно максимально разогнать для получения более высоких значений хешрейта. Разумеется, при этом будет страдать энергоэффективность майнинга.

Не все фермы уверенно работают со всеми алгоритмами. Поэтому каждому серьёзному майнеру необходимо самостоятельно проверить работу своих карт в минимуме и в максимуме, после чего выбрать для них оптимальный режим, исходя из температуры эксплуатации и стоимости электроэнергии.

ASIC-майнер для Эфириума

Полученные результаты можно сохранить в виде готовых ссылок на калькулятор 2Cryptocalc, который позволит всего в несколько кликов оценить, насколько выбранный вами алгоритм лучше или хуже аналогов по текущей прибыльности майнинга именно для ваших ферм.

Стоимость электроэнергии и текущая прибыльность являются ключевым факторами выбора алгоритма и режима работы фермы.

Максимальная энергоэффективность и её значение при сборе новых ферм

Как правило все майнеры рано или поздно приходят к оценке максимальной скорости на 1 кВт мощности ферм. Кто-то делает это из-за цены электроэнергии, кто-то — из-за достижения пределов условно-бесплатных розеток.

Максимально достижимые скорости за вычетом devfee на 1 кВт мощности из стены на платиновом блоке питания для серий 10хх, 20хх и 30хх выглядят следующим образом:

* — данные по 30хх приведены по состоянию на 25 декабря 2020 года.

Как легко видеть, предельный базовый доход с одного киловатта энергии у серии 20хх почти везде в 1. 5 раза выше, чем у предшествующей. Это связано в первую очередь с улучшенным алгоритмом доступа к памяти. Для алгоритмов, которые в основном задействуют ядро видеокарты, эффект не столь внушительный: прирост около 33%.

С каждой новой эпохой Эфира энергоэффективность чуть ухудшается.

Постскриптум

Весь 2021 год обещает быть очень продуктивным по новым моделям карт, а с появлением каждой новой карты или программ-майнеров расклад сил может существенно измениться. Возможно, мы увидим и новые алгоритмы майнинга — кто знает. Статья в текущем виде актуальна на начало марта 2021 и будет активно дополняться по мере поступления новых данных.

Обсудить любые вопросы и решения вы всегда можете в Телеграм-чате майнинг-пула 2Miners. Также заглядывайте и на сам пул.

ПОДПИСЫВАЙТЕСЬ НА НАШ КАНАЛ В ТЕЛЕГРАМЕ, ЧТОБЫ БЫТЬ В КУРСЕ.

Таблицы для майнинга: виды, характеристики, как использовать

Покупка и настройка собственной майнинговой фермы требует немалых финансовых вложений и понимания технических характеристик. Разобраться в параметрах оборудования поможет таблица майнинга, которая сравнивает модели видеокарт, процессоров и готовых ферм по ряду характеристик. Такие таблицы помогают выбрать оборудование, исходя из объёма памяти, тактовой частоты GPU и процессора, мощности, стандартов питания.

Перечень характеристик оборудования, указанный в таблице, позволяет оценить прибыльность (доходность) процесса, рассчитать срок окупаемости. Например, приобретение топовых видеокарт для майнинга Эфириума приносит быстрый доход, графические платы быстро устаревают и не успевают окупиться в долгосрочной перспективе. Таблицы майнинга разделяются по видам оборудования (видеокарты, процессоры, ASIC-установки), производителям (видеокарты AMD, NVIDIA), анализируют сложность добычи разных монет или продуктивность всех видеокарт.

Содержание статьи:

Видеокарты GPU

Сводные таблицы майнинга графических адаптеров анализируют ключевые показатели, с учётом которых приобретают графические платы:

  1. Количество встроенной памяти, ГБ. Майнинг Эфириума и других популярных криптомонет стабильно нагружает ОЗУ, поэтому чем больше этот показатель, тем более производительна графическая плата.
  2. Тактовая частота процессора. Этот показатель определяет скорость обработки блоков, поэтому рекомендуется выбирать наибольшее значение.
  3. Мощность видеокарты для майнинга. Графические платы в штатном режиме имеют мощность от 75 до 250 Ватт, в регионах с высокими тарифами на электроэнергию распространён даунвольтинг. Процесс уменьшает мощность платы, чтобы снизить затраты на оплату счетов.

Процессоры CPU

Майнинг с использованием мощностей центрального процессора рентабелен, если алгоритм криптовалюты не подходит для майнинга на ASIC-установках или мощных видеокартах. Например, майнить Монеро или Эфир можно с использованием CPU и нескольких графических плат. Таблицы для CPU содержат ряд параметров:

Модель видеокартыОбъём памяти, ГБЧастота GPU, МегагерцыМощность видеокарты, Ватты
Nvidia GeForce 1050 Ti41,39275
Nvidia GeForce 1080 Ti111,375250
Nvidia P10661,708120
AMD Radeon RX 570

 

8926120
AMD Radeon RX Vega 5681,471210
AMD Radeon Vega 6481,546295

  1. Скорость обработки блоков или хешрейт. Показатель оценивает быстродействие процессора, его способность приносить доход в условиях возрастающей сложности.
  2. Тактовая частота процессора. Количество вычислительных операций, исполняемых за единицу времени (обычно — за секунду). Оценивает быстродействие процессора.
  3. Количество ядер. Позволяет оценить стабильность оборудования, способность разогнать процессор для более эффективной работы.
Модель CPUХешрейт, Килохеш в секундуЧастота CPU, ГигагерцыКоличество ядер
Intel Pentium Core 2 Duo T950017,762,62
Intel Xeon E562026,42,44
AMD Phenom II X6 1055 T40,13,56
AMD FX-83506548
Power Mac8,52,32
IBM Power 716,43,18

 

 ASIC-майнеры

ASIC — более производительный аналог традиционных ферм, состоящих из нескольких видеокарт. Асики представляют собой завершённую, готовую к эксплуатации конструкцию из нескольких плат, мощного блока питания и корпуса. Перед началом работы пользователь включает установку в сеть, подсоединяет Ethernet-кабель и устанавливает программу-клиент.

Особенностями ASIC-майнеров выступает их высокая цена (от нескольких тысяч долларов), сравнительно быстрый износ оборудования, невозможность апгрейда или ремонта фермы, высокий уровень шума вентиляторов при работе.

Благодаря этим отличиям асики относятся к единственному рентабельному оборудованию для майнинга Биткоинов в домашних условиях. ASIC-установки сравнивают по ряду показателей:

  1. Скорость обработки блоков или хешрейт. Благодаря узкой специализации производительность ASIC достигает десятков Гигахеш в секунду.
  2. Энергоэффективность или количество потребляемой энергии на каждый Гигахеш обработанных блоков. Таблица позволяет оценить экономичность каждой модели.
  3. Допустимый алгоритм. ASIC-установки собраны для работы с одним из алгоритмов шифрования, поэтому с помощью таблиц проще подобрать оптимальную модель.

Майнинг на процессоре — сравнение

Майнинг криптовалют на CPU в 2019 году может принести доход, если выбирать последнюю модель оборудования, проводить аппаратный разгон и следить за курсом добываемых монет. Центральный процессор обычного ПК устанавливается на материнской плате, адаптированной для майнинга.

Модель ASIC-майнераХешрейт, Гигахеш/секЭнергоэффективность, Ватт/ГигахешАлгоритм
Bitmain Antiminer S913,598SHA 256
Baikal X11 Asic Mini Miner0,155,4X11
Baikal Giant+21,1Quark
iBeLink DM22G X11222,5X11
Innosilicon A4 Dominator0,286,15Scrypt
Canaan Creative Avalon 6350,85SHA256

Расчеты майнинга на процессоре позволяют сравнить показатель тактовой частоты, скорости обработки блоков (хешрейта) и стоимости CPU в розничных магазинах. В целях экономии средств рекомендуется приобретать б/у процессоры у геймеров или в офисных центрах.

Модель процессораТактовая частота, ГигагерцХешрейт, Килохеш в секундуКоличество ядер
Intel Core 2 Quad Q95503,432,24
Intel Core i52,532,84
Intel Xeon E5-26502129,34
AMD Athlon 64 X22,86,72
AMD Phenom II 1045 T2,730,46
AMD FX-83504658

Сравнительная таблица майнинга показывает, что наиболее важный параметр для фермы — количество ядер CPU. Например, при меньшей тактовой частоте Intel Xeon E5-2650, имеющий 4 ядра, демонстрирует в 20 раз более производительный хешрейт, чем AMD Athlon 64 X2 с парой ядер.

Такие результаты обусловлены высокой загрузкой CPU однотипными задачами, которые необходимо решать в ходе обработки блоков.

Сложности майнинга криптовалют

Показатель отражает количество активных майнеров, которые на данный момент обрабатывают цепочки блоков в Сети. Сводные таблицы сложности добычи располагаются на криптовалютных биржах, однако наиболее достоверный источник информации — официальный сайт разработчиков проекта.

Сложность наиболее популярных видов криптомонет:

  1. Биткоин. Уровень сложности измеряется в Террахеш за секунду, то есть скорости решения математических задач всеми пользователями. Среднее значение составляет 10 минут, однако показатель колеблется в зависимости от времени суток, курса валюты и числа пользователей. Данные можно проверять на blockchain.
  2. Эфириум. Продолжительность обработки блоков при майнинге отслеживается и контролируется создателями проекта, средний показатель составлят 30 секунд. Данные можно проверить на ethereum.org.

Динамику сложности майнинга криптовалют невозможно прогнозировать, поэтому необходимо отслеживать сервисы (например, bitmakler.com), которые сопоставляют показатели для каждой монеты.

Майнинга на NVIDIA

Видеокарты для майнинга этого производителя относятся к наиболее эффективным платам, позволяющим добывать Ethereum, Litecoin, Monero и другие популярные виды криптовалют. Технически наиболее эффективно для добычи монет поколение GeForce GTX, модели 1060 и старше. Конкретные показатели зависят от производителя, в среднем анализируются три параметра:

  1. Производительность памяти. Количество операций, которые графический процессор может выполнить за секунду.
  2. Хешрейт или скорость обработки блоков. Стандартная характеристика для всего майнингового оборудования.
  3. Доступные алгоритмы. Выгодные криптовалюты для добычи на адаптерах — Ethereum, Monero, ZCash, форки, работающие на аналогичных алгоритмах.

Модель видеокарты NVIDIAТактовая частота, ГигагерцХешрейт, Килохеш в секундуДоступные алгоритмы
780 Ti1,3230Neoscrypt
980 Ti6,62163Ethereum
GTX 560 Ti4,02054Blake 256 (Decred)
GTX 750 Ti2,7350Neoscrypt
GTX 780 Ti3,6220Ethereum
GTX 970 Jetstream1,7646Neoscrypt

 

Сравнение всех видеокарт

Сводные таблицы майнинга, перечисляющие все параметры графических адаптеров, призваны облегчить новичкам выбор наиболее подходящей модели.

Оборудование сравнивается по десяткам показателей, среди которых выделяются наиболее важные:

  1. Производитель. Одинаковые модели видеокарты, выпущенные разными компаниями, могут иметь уникальные характеристики. Например, адаптер GTX 970 от NVIDIA, выпущенный компанией Asus, даёт скорость в 18,9 Мегахеш за секунду, а его аналог от Gigabyte — уже 23 Мегахеш.
  2. Тактовая частота. Теоретически скорость процессора влияет на прибыльность добычи, на практике более важный параметр — уровень энергопотребления и возможность разгона оборудования.
  3. Доступные алгоритмы. Большинство видеоплат адаптировано для работы с одним алгоритмом, поэтому важно выбрать самый выгодный.
  4. Рабочая температура. Видеокарты, способные работать при нагревании до 80 градусов, снизят затраты на дополнительное охлаждение системы.

Лучшие видеокарты для майнинга 2017-2018, таблица и рейтинг

Выбираем лучшие видеокарты для майнинга в 2017-2018 году. В этой статье будет описано какие видеокарты лучше выбрать для майнинга, на каких картах хорошо майнить сразу две валюты, какие проще всего настроить.


Содержание:

До начала 2017 года самыми популярными картами  для майнинга были RX470, RX480. Так уж исторически сложилась архитектура карт от AMD, что они оказались намного выгоднее «зеленых». Цены варьировались в пределах 10 500 — 15 000, в зависимости от характеристик и производителя. А соотношение стоимости к производительности было просто превосходным. Но вот уже изо всех углов только и говорят о майнинге Ethereum, вспоминают былые времена, когда ещё  была выгодна добыча Bitcoin на домашнем оборудовании. С ростом популярности майнинга и огромным ажиотажем, местные ритейлеры взвинтили цены до не бывалых высот, но даже это не спасло от тотального дефицита по всей Росссии.

Тогда пытливый ум наших соотечественников и майнеров из других стран потихоньку начал приспосабливать карты от nVidia для ферм по добыче zCash, а позже и Ethereum’a.

 

Вечный вопрос NVIDIA vs ATI

Если вы занимаетесь майнингом криптовалют в качестве хобби, то однозначно стоит остановить свой выбор на RX-серии от AMD. Только с этими картами вы познаете все прелести майнинга: прошивка bios,  бессонные ночи около фермы, краши системы от переразгона и правильная организация питания.На самом деле не все так страшно, но с ATI, без опыта, придется повозится значительно дольше. Для профессионалов, при создания манинг-шахт, так же лучше подойдут карты от «красных», если такое производство строится за счет собственных средств.

Если же для заработка на майнинге вы хотите влезть в долговую яму, взяв кредит, тот тут остается только nVidia с их серией GTX. Вы и так возьмете на себя огромный риск, но хоть не будете думать об отвале ригов. Также карты от эн видиа подойдут на безрыбье, если других карт попросту нет.

P.S. Видеокарты Radeon проблематичны в настройке — драйвера встают не с первого раза, или работают некорректно. Но на них очень хорошо майнить одновременно две валюты (например ethereum + decreed). А это не может не радовать, ведь окупаемость уменьшается до 154 дней. Видеокарты от nVidia не требует прошивки bios в отличии от амд. Читайте также: Как разогнать видеокарты?

Какие видеокарты подходят для майнинга?

Вот, список видеокарт на которых можно майнить криптоволюты хоть с каким-то профитом:

Radeon от AMD:

  • Radeon RX 460
  • Radeon RX 470
  • Radeon RX 480
  • Radeon RX 570
  • Radeon RX 580

Geforce от nVidia:

  • Geforce GTX 1050 ti
  • Geforce GTX 1060
  • Geforce GTX 1060 ti
  • Geforce GTX 1070
  • Geforce GTX 1070 ti
  • Geforce GTX 1080
  • Geforce GTX 1080 ti

Какие видеокарты быстрее всего окупятся в майнинге?

Список лучших видеокарт по показателю стоимость/производительность:

GPU:  Хешрейт Ethash: Цена Computer Universe (промокод на скидку 5€:  FWTGWBP)
Radeon RX 470, 570 27,5 Mh/s, 28 Mh/s 16 700
Radeon RX 480, 580 29 Mh/s, 30,3 Mh/s 18 500
Geforce GTX 1060 24 Mh/s 15 300
Geforce GTX 1070 28 Mh/s 27 000

Может быть интересно: Как покупать на computeruniverse?

Окупаемость:

 

Каких производителей лучше всего выбрать?

С архитектурой определились, осталось выбрать производителя.

Среди Radeon хорошо себя зарекомендовали следующие производители: MSI, Sapphire, Asus.

  • MSI — только Gaming X серия, Armor брать не рекомендуем
  • Asus — только Strix серия, Dual использовать не советуем
  • Sapphire — достойные Nitro, Nitro+ без этих надписей покупать не стоит, также у сапфиров текут термопрокладки, нужно обслуживать

Среди GTX выделились следующие производители: MSI, Asus, nVidia.

  • MSI — аналогично RX, только Gaming X серия
  • Asus — для 1060, 1070 все серии, включая референсные (сделанные по дизайну самого производителя)
  • nVidia — на данный момент предлагают только турбинные видеокарты

Немного юмора: Palit — ваш дом спалит.

 

Управление электропитанием оборудования для майнинга / RCNTEC

Как выбрать видеокарту для майнинга

Если вы думаете, что можно выбрать любую видеокарту, купить ее, начать майнить, и сразу же начать зарабатывать огромное количество денег, то вы очень сильно ошибаетесь. Видеокарта должна соответствовать определенным параметрам, и это не только хэшрейт, который она будет выдавать при добыче. Давайте подробнее рассмотрим параметры, на которые стоит обратить внимание, я расположил все параметры по важности:

  • Хэшрейт — количество хешей, которые видеокарта сможет проверить за одну секунду. Естественно, что чем выше этот показатель, тем больше монет вы сможете добыть. При соло-майнинге будет выше вероятность того, что вы добудете блок, а в варианте с пулом просто будут больше отчисления;
  • Объем памяти — многие криптовалюты, которые сейчас майнятся на видеокартах имеют защиту от майнинга на специальном оборудовании ASIC, в том числе и Ethereum. Один из таких методов защиты — это алгоритм с использованием DAG файла (специальной таблицы) для генерации хэшей. Эта таблица имеет большой объем и должна постоянно находиться в памяти видеокарты. У ASIC просто нет столько памяти, поэтому они оказываются совсем неэффективными. Например, DAG файл эфира на данный момент занимает 2.3 Гб и через каждые 30 000 блоков он увеличивается. Когда этот объем станет больше 3 Гб, все старые видеокарты с таким объемом памяти выйдут из игры. Узнать размер DAG файла можно с помощью калькулятора;
  • Энергопотребление — тоже очень важный параметр, который нужно учитывать в связке с доходностью и стоимостью электричества. Например, если видеокарта добывает криптовалюты на $1 в день и за потраченное на добычу электричество вы заплатите $1 в день, то вам будет проще купить криптовалюту на бирже за эти же деньги и не мучить свою вдиеокарту, а потом заработать на росте курса;
  • Охлаждение — видеокарта должна иметь хорошую систему охлаждения. Нужно учитывать, что ваша видеокарта будет трудиться 24 часа в сутки, 7 дней в неделю, и если она будет работать все время при температуре 80-90 градусов, то работать она будет недолго. Поэтому материал корпуса, количество вентиляторов тоже имеют значение;
  • Частота памяти — чем лучше и быстрее память видеокарты — тем больше хэшрейт вы получите, поэтому если стоит выбор больше или меньше частота — то лучше брать больше. Также стоит обращать внимание на тип памяти. Тип DDR5 будет энергоэффективнее и быстрее, чем более ранние версии.

А теперь давайте перейдем непосредственно к списку лучшие карты для майнинга 2020, сначала мы рассмотрим все модели, а потом сделаем их краткое сравнение в таблице — рейтинг видеокарт для майнинга по эффективности.

Настройка таймингов памяти для видеокарт

Для настройки таймингов есть несколько команд:

—mt, —memory-tweak — тайминги памяти оптимизированы для видеокарт Nvidia GDDR5 и GDDR5X. Доступный диапазон [1-6]. Чем выше значение, тем выше хэшрейт.

Для разных карт значение может быть установлено через список через запятую. Может потребоваться настроить ограничение мощности (Power limit), чтобы получить больше хэшрейта.

Более высокая доля брака может возникнуть, если ферма достигнет критической температуры, более низкое значение -mt может снизить коэффициент брака.

В Windows пользовательский драйвер должен быть установлен перед использованием -mt, подробности смотрите в описании команды —driver.

Для запуска под Linux требуются права администратора, sudo ./nbminer -mt x.

Таблетка «OhGodAnETHlargementPill» больше не нужна, если включен -mt при майнинге на 1080 и 1080ti.

Команда —driver нужна только для Windows. Она устанавливает или удаляет драйвер для «оптимизации памяти».

Запустите батник с правами администратора.

Установить драйвер: nbminer.exe —driver install

Удалить драйвер: nbminer.exe —driver uninstall

Примечание: установленный пользовательский драйвер не подписан Microsoft, пользователям необходимо отключить безопасную загрузку в настройках BIOS, чтобы драйвер заработал.

Лучшие видеокарты для майнинга 2020

Сначала рассмотрим лучшие видеокарты Nvidia для майнинга, затем перейдем к картам от компании AMD.

Nvidia GTX 1080 Ti

GTX 1080 Ti — это самая лучшая видоекарта для майнинга 2018 среди карт от компании NVIDIA, она имеет самую высокую производительность среди других видеокарт этого же производителя. К тому же, это еще и самая новая видеокарта. Компания разрабатывала ее для игр, но майнеры очень быстро нашли ей применение. Благодаря высокой производительности и низкому энергопотреблению это отличный вариант. К преимуществам карты можно отнести максимальный хэшрейт, а к недостаткам слишком высокую цену. Основные характеристики:

  • Год выпуска: 2017;
  • Тип памяти: GDDR5X;
  • Объем памяти: 11 ГБ;
  • Архитектура: Pascal;
  • Пропускная способность: 352 бит;
  • Количество ядер CUDA: 3584;
  • Частота ядра: 1480 МГц;
  • Энергоэффективность: 250 Вт;
  • Дополнительное питание: да;
  • Хэшрейт Ethereum: 32 mh/s;
  • Хэшрейт ZCash: 750 sol/s;
  • Хэшрейт Lyra2z: 3100 kh/s;
  • Хэшрейт Lyra2v2: 3100 kh/s;
  • Хэшрейт Lyra2REv2: 48 mh/s;
  • Хэшрейт X11: 17 mh/s;

Nvidia GTX 1070 Ti

Еще одна новая видеокарта, которая появилась осенью 2020 года, она имеет более низкие характеристики, чем GTX 1080 Ti, но все еще остается отличной игровой видеокартой, которую можно успешно использовать для майнинга. Главное преимущество карты — хорошее соотношение цены и производительности, а также более высокая энергоэффективность, чем у GTX 1080. Основные характеристики:

  • Год выпуска: 2017;
  • Тип памяти: GDDR5X;
  • Объем памяти: 8 ГБ;
  • Архитектура: Pascal;
  • Пропускная способность: 256 бит;
  • Количество ядер CUDA: 2432;
  • Частота ядра: 1683 МГц;
  • Энергоэффективность: 180 Вт;
  • Дополнительное питание: да;
  • Хэшрейт Ethereum: 31 mh/s;
  • Хэшрейт ZCash: 450 sol/s;
  • Хэшрейт Lyra2REv2: 48 mh/s;
  • Хэшрейт X11: 17 mh/s;

3 Nvidia GTX 1070

Несмотря на то, что две, расположенные выше, видеокарты для майнинга имеют более серьезные характеристики, эта карта по совокупности параметров это лучшая видеокарта для майнинга эфира. Она имеет более низкое энергопотребление и тот же хэшрейт. Основные характеристики:

  • Год выпуска: 2016;
  • Тип памяти: GDDR5;
  • Объем памяти: 8 ГБ;
  • Архитектура: Pascal;
  • Пропускная способность: 256 бит;
  • Количество ядер CUDA: 1920;
  • Частота ядра: 1683 МГц;
  • Энергоэффективность: 150 Вт;
  • Дополнительное питание: да;
  • Хэшрейт Ethereum: 33 mh/s;
  • Хэшрейт ZCash: 490 sol/s;
  • Хэшрейт Lyra2REv2: 40 mh/s;
  • Хэшрейт X11: 13 mh/s;
  • Хэшрейт Neoscrypt: 1,1 mh/s.

С картами от NVIDIA все, теперь поговорим про лучшие видеокарты Radeon для майнинга.

Radeon Vega Frontier Edition

Radeon Vega Frontier Edition — это одна из новых карт, разработанных на основе архитектуры Vega. Она рассчитана не столько для игр, сколько для различных вычислений и науки. Карта вышла в 2017 году и поставляется с рекордными на данный момент 16 Гб встроенной памяти. Более подробные параметры:

  • Год выпуска: 2017;
  • Тип памяти: HBM2;
  • Объем памяти: 16 ГБ;
  • Архитектура: Vega 10;
  • Пропускная способность: 2048 бит;
  • Количество ядер: 4096;
  • Частота ядра: 1382МГц;
  • Энергоэффективность: 300 Вт;
  • Дополнительное питание: да;
  • Хэшрейт Ethereum: 48 mh/s;
  • Хэшрейт ZCash: 700 sol/s;
  • Хэшрейт X11: 11 mh/s;
  • Хэшрейт CryptoNight: 900 h/s;

Radeon RX VEGA 56

Одна из самых производительных видеокарт от Radeon — это RX VEGA 56. Это новая карта, которая появилась немного раньше NVIDIA 1070 Ti, а августе 2020. Она дает отличную производительность для майнинга Ethereum и Monero, а также лучшую энергоэффективность по сравнению с картами от Nvidia. К недостаткам можно отнести то, что карта показывает себя хорошо только на некоторых алгоритмах. Основные характеристики:

  • Год выпуска: 2017;
  • Тип памяти: HBM2;
  • Объем памяти: 8 ГБ;
  • Архитектура: Vega 10;
  • Пропускная способность: 2048 бит;
  • Количество ядер: 3584;
  • Частота ядра: 1156 МГц;
  • Энергоэффективность: 210 Вт;
  • Дополнительное питание: да;
  • Хэшрейт Ethereum: 42 mh/s;
  • Хэшрейт ZCash: 480 sol/s;
  • Хэшрейт CryptoNight: 1800 h/s;
  • Хэшрейт X11: 12 mh/s;

Radeon RX VEGA 64

Эта видеокарта вышла одновременно с RX VEGA 54, она имеет немного выше энергопотребление, и другие характеристики, которые должны были бы дать преимущество при майнинге, но нет, хэшрейт остается приблизительно таким же, как и для предыдущей версии. Характеристики:

  • Год выпуска: 2017;
  • Тип памяти: HBM2;
  • Объем памяти: 8 ГБ;
  • Архитектура: Vega 10;
  • Пропускная способность: 2048 бит;
  • Количество ядер: 4096;
  • Частота ядра: 1274МГц;
  • Энергоэффективность: 295 Вт;
  • Дополнительное питание: да;
  • Хэшрейт Ethereum: 44 mh/s;
  • Хэшрейт ZCash: 520 sol/s;
  • Хэшрейт CryptoNight: 1990 h/s;
  • Хэшрейт X11: 13 mh/s;

Radeon RX 580

Эта карта относится к новой линейке видеокарт от Radeon, которые были выпущены на замену картам серии RX 400. Здесь были улучшены многие характеристики, охлаждение, а значит и производительность в майнинге тоже выросла. Характеристики:

  • Год выпуска: 2017;
  • Тип памяти: GDDR5;
  • Объем памяти: 8 ГБ;
  • Архитектура: Polaris 20;
  • Пропускная способность: 256 бит;
  • Количество ядер: 2304;
  • Частота ядра: 1257МГц;
  • Энергоэффективность: 185 Вт;
  • Дополнительное питание: да;
  • Хэшрейт Ethereum: 30 mh/s;
  • Хэшрейт ZCash: 320 sol/s;
  • Хэшрейт X11: 9 mh/s;

Radeon RX 570

Более дешевая версия видеокарты Radeon RX 580, некоторые характеристики немного ниже, также ниже потребление энергии. Но в майнинге она показывает себя почти так же, как и топовые видеокарты для майнинга 2020.

  • Год выпуска: 2017;
  • Тип памяти: GDDR5;
  • Объем памяти: 8 ГБ;
  • Архитектура: Polaris 20;
  • Пропускная способность: 256 бит;
  • Количество ядер: 2048;
  • Частота ядра: 1168МГц;
  • Энергоэффективность: 120 Вт;
  • Дополнительное питание: да;
  • Хэшрейт Ethereum: 28 mh/s;
  • Хэшрейт ZCash: 250 sol/s;
  • Хэшрейт X11: 8 mh/s;

Radeon RX 470

Новую видеокарту Radeon RX 470 найти уже будет не так просто, потому что это уже прошлое поколение и ему на смену пришла серия 500, которая сейчас активно продвигается. Тем не менее, эти карты все еще популярны среди майнеров, потому что они имеют достаточно высокую производительность, а их цена ниже, чем у топовых моделей, если, конечно, вы сможете ее найти.

  • Год выпуска: 2016;
  • Тип памяти: HBM;
  • Объем памяти: 8 ГБ;
  • Архитектура: Polaris;
  • Пропускная способность: 4096 бит;
  • Количество ядер: 4096;
  • Частота ядра: 1050МГц;
  • Энергоэффективность: 256 Вт;
  • Дополнительное питание: да;
  • Хэшрейт Ethereum: 20 mh/s;
  • Хэшрейт ZCash: 490 sol/s;
  • Хэшрейт X11: 6 mh/s;

Radeon RX 480

Эта видеокарта появилась в 2020 году и тогда она позиционировалась как самая быстрая карта на архитектуре Polaris. Эта карта имеет лучшие характеристики, чем RX 470, но в майнинге дает ненамного худший результат, поэтому она все еще актуальна.

  • Год выпуска: 2016;
  • Тип памяти: GDDR5;
  • Объем памяти: 8 ГБ;
  • Архитектура: Polaris;
  • Пропускная способность: 256 бит;
  • Количество ядер: 2304;
  • Частота ядра: 1120МГц;
  • Энергоэффективность: 150 Вт;
  • Дополнительное питание: да;
  • Хэшрейт Ethereum: 24 mh/s;
  • Хэшрейт ZCash: 220 sol/s;
  • Хэшрейт X11: 11 mh/s;

Radeon R9 Fury X

Radeon Fury X — это достаточно старая видеокарта, которая вышла еще в 2020 году. Она использует архитектуру Fiji и построена на основе техпроцесса 28 нм, это в два раза больше, чем современные видеокарты (14 нм), что повышает потребление энергии, но эта карта все еще дает хэшрейт при майнинге сопоставимый с топовыми картами от NVIDIA. Особенности:

  • Год выпуска: 2015;
  • Тип памяти: HBM;
  • Объем памяти: 4 ГБ;
  • Архитектура: Fiji XT;
  • Пропускная способность: 4096 бит;
  • Количество ядер: 4096;
  • Частота ядра: 1050МГц;
  • Энергоэффективность: 256 Вт;
  • Дополнительное питание: да;
  • Хэшрейт Ethereum: 33 mh/s;
  • Хэшрейт ZCash: 490 sol/s;
  • Хэшрейт X11: 6 mh/s;

Теперь вы знаете какие видеокарты лучше для майнинга 2020, дальше рассмотрим специальные видеокарты.

Производительность и цена на 18.01.2017

GPU:Модель:Хешрейт Ethash:Хешрейт Equihash: Цена Comp.universeЦена Регард:
Radeon RX 470Radeon RX 470 Sapphire Nitro+ OC PCI-E 4096Mb24 Mh/s240 H/s (Claymore 11.1)11 694 р.13 690 р.
Radeon RX 470 PowerColor Red Devil PCI-E 4096Mb24 Mh/s240 H/s (Claymore 11.1)11 114 р.13 230 р.
Radeon RX 480Radeon RX 480 PowerColor Red Dragon PCI-E 8192Mb25 Mh/s260 H/s (Claymore 11.1)14 300 р.16 010 р.
Radeon RX 480 Sapphire Nitro+ PCI-E 8192Mb25 Mh/s260 H/s (Claymore 11.1)15 151 р.17 730 р.
Geforce GTX 1060GeForce GTX1060 Palit Dual PCI-E 3072Mb20 Mh/s290 H/s (EWBF’s 0.2.0b)12 226 р.13 710 р.
Geforce GTX 1070GeForce GTX1070 Palit Dual PCI-E 8192Mb28 Mh/s420 H/s (EWBF’s 0.2.0b)23 346 р.27 030 р.
Radeon Fury XRadeon R9 Fury X ASUS PCI-E 4096Mb27 Mh/s385 H/s (Claymore 11.1)30 540 р.
Radeon R9 Fury X Sapphire PCI-E 4096Mb27 Mh/s385 H/s (Claymore 11.1)26 537 р.

*все хешрейты указаны для видеокарт на стоковых частотах и без биос-модов. Для определения хешрейта использовались самые последние версии майнинг-софта на 18.01.2017.

Специальные видеокарты для майнинга

Компании AMD и NVIDIA, поддавшись ажиотажу вокруг майнинга решили выпустить специальные видеокарты, которые будут давать более высокую производительность во время майнинга, а также не будут иметь разъемов графического вывода:

Radeon Mining RX 470

Компания AMD тоже поддалась тенденциям рынка и выпустила видеокарту, предназначенную специально для майнинга. Здесь тоже улучшено охлаждение, убраны слоты для графического вывода, а также существенно снижен строк гарантии. Но производительность майнинга по сравнению с версией 470 была немного увеличена. Рассмотрим ее характеристики:

  • Год выпуска: 2017;
  • Тип памяти: GDDR5;
  • Объем памяти: 8 ГБ;
  • Архитектура: Polaris;
  • Пропускная способность: 256 бит;
  • Количество ядер: 2048;
  • Частота ядра: 926МГц;
  • Энергоэффективность: 128 Вт;
  • Дополнительное питание: да;
  • Хэшрейт Ethereum: 24-27 mh/s;
  • Хэшрейт ZCash: 400-500 sol/s;

13. Nvidia P106-100 (GeForce GTX 1060)

Эта карта была выпущена компанией NVIDIA специально для майнинга на основе видеокарты GTX 1060. Она имеет улучшенную систему охлаждения, не имеет слотов для подключения графического вывода, а также более производительна в майнинге по сравнению с обычной игровой GTX 1060. Но до лидеров 1070 и 1080 она все еще не дотягивает. Основные характеристики:

  • Год выпуска: 2017;
  • Тип памяти: GDDR5;
  • Объем памяти: 6 ГБ;
  • Архитектура: Pascal;
  • Пропускная способность: 192 бит;
  • Количество ядер CUDA: 1280;
  • Частота ядра: 1683 МГц;
  • Энергоэффективность: 120 Вт;
  • Дополнительное питание: да;
  • Хэшрейт Ethereum: 20 mh/s;
  • Хэшрейт ZCash: 290 sol/s;

Sapphire и его карты для майнинга на основе RX 560 и RX 470

Ах майнинг. Возрождение старого увлечения. Кто не хочет повышать температуру своей комнаты до безумных уровней в течение лета, чтобы нажиться на майнинге? Кто не хочет вытаскивать свое оборудование напрягая лодыжки и запястья, увеличивая его использование, чтобы поддерживать криптографическую безопасность PoW (proof of Work) в криптотермии? По-видимому, это малозначительное число пользователей и потенциальных шахтеров. Это, в свою очередь, оказало большое давление на рынок графических карт от ботов AMD и NVIDIA, и цены, которые, как вам известно, растут и растут на видеокарты в ценовых диапазонах от 200 до 400 долларов США. Пока неясно, уменьшается ли поток новых горнодобывающих компаний сейчас, учитывая недавнюю коррекцию рынка (читай: dip) в криптовалютной рыночной стоимости (около 42% от рекордного максимума в 357 € [~400 $] в июне 12).

После ASUS похоже, пришло время Sapphire попробовать поколебать шахтеров своими ориентировано потребительскими графическими картами, запустив пять различных моделей, специально предназначенных для майнинга. В настоящее время девайсы доступны для предварительного заказа на Overclockers UK, присутствует пять разных продуктов, один из которых основан на RX 560 и четыре варианта на RX 470 (нет, это не опечатка, это действительно 400 серия).

RX 560 Pulse Mining Edition отличается своей конструкцией кожуха и единственным выходом DVI (обычная версия оснащена дополнительными портами HDMI и DisplayPort). Его TDP равный 60 Ватт должен быть достаточно хорошим, чтобы обеспечить около 12-15 MH/s через 13-тактный генератор с тактовой частотой 1300 МГц и 1750 МГц GDDR5 памяти (размер 4 ГБ, поэтому, возможно, смотрим здесь). Однако использование единственного 90-мм вентилятора для охлаждения карты не означает, что температуры не будут такими низкими, которыми могут быть.

С другой стороны, версии RX 470 являются интересными монстрами. Мало того, что они основаны на исходной конфигурации Polaris (рассчитанной на более низкое энергопотребление и более низкие частоты, чем текущие серии RX 500), у них нет дисплей выходов (смысл для горнодобывающих установок есть). Кроме того, и это самое интересное, Sapphire различает свои видеокарты RX 470 не только размером пула памяти (версии 4 ГБ и 8 ГБ), но и собственно её производителем. А именно, видеокарты RX 470 для майнинга, изготовленные с помощью микросхем Samsung, получают премию в 10 £ (фунтов стерлингов) относительно братьев, поддерживающих SK Hynix, из-за более высокого разгонного потенциала микросхем Samsung (для тех, кто не знает, скорость и разгон памяти — один из лучших способов увеличить мощность хэширования видеокарты, особенно для Ethereum). Версия с памятью Samsung (260 £ и 300 £ для версий 4 и 8 ГБ соответственно), по прогнозам, будет генерировать 25 до 28 MH/s, в то время как версии SK Hynix (250 £ и 290 £ для версий 4 ГБ и 8 ГБ) должны генерировать от 24 до 27 MH/s.

С уважением, procompsoft.ru

Рейтинг видеокарт для майнинга

Для того чтобы вы смогли более наглядно сравнить все перечисленные выше видеокарты, мы собрали основные параметры в таблицу и отсортировали лучшие карты для майнинга по энергоэффективности (ватт/mh).

ВидеокартаЭнергопотреблениеМайнинг Eth (mh/s)Эффективность Eth (ватт/mh)Майнинг Zcash
Radeon RX 570120284,3250
Nvidia GTX 1070150334,5490
Radeon RX VEGA 56210425480
Nvidia GTX 1070 Ti180315,8450
Radeon RX 580185306,1320
Radeon Vega Frontier Edition300486,25700
Radeon RX 480150246,2220
Radeon RX VEGA 64295446,7520
Radeon R9 Fury X256337,7490
Nvidia GTX 1080 Ti250327,8750
Radeon RX 4702562013490

Если посмотреть этот рейтинг видеокарт для майнинга, то получается, что на данный момент, самая лучшая видеокарта для майнинга 2020 — Radeon RX 570. Но тут еще нужно учитывать ее цену и цену криптовалюты. Я намеренно не приводил в статье срок окупаемости, поскольку цена монет постоянно меняется.

Рентабельность майнинга

В последнее время часто доводится слышать мнение, что майнинг стал нерентабельным. Это, конечно же, говоря более мягко, совсем неправда. Многих людей очень разбаловал стремительный скачок валют в конце 2020 года, когда купленное даже в два раза дороже оборудование, по расчётам, можно было окупить за три, максимум четыре месяца. Но на самом деле как раз такой ажиотаж был весьма аномальным, а сейчас валюты пришли для себя в относительную норму. Скорее всего, криптомонеты продолжат свой рост после текущей коррекции, но он уже вряд ли будет настолько взрывным и стремительным.

Рентабельность видеокарт во многом зависит от того, какую именно криптовалюту вы предпочитаете на них добывать, и насколько активно эта валюта растёт в цене. Именно поэтому невозможно дать точный прогноз окупаемости сразу после входа в майнинг. Сегодня вы майните валюту по одной цене и ваша окупаемость семь месяцев, завтра она подорожала и – вуаля! – окупаемость видеокарт снизилась до пяти месяцев. То же работает и в обратную сторону – сегодня вы рассчитываете окупиться за семь месяцев, а завтра добываемая вами валюта позволяет рассчитывать в лучшем случае на десять месяцев окупаемости. Майнинг – это всегда довольно рискованное предприятие.

Однако, конечно же, никто не мешает вам переходить с валюты на валюту, когда их профитность меняется или вообще пользоваться сервисом NiceHash, где самую прибыльную на данный момент криптовалюту определяет для вас сам сервис. Таким образом вы всегда сможете получать самую высокую выгоду от майнинга из возможной. Для того же, чтобы сориентироваться на рынке валюты в данный момент времени и определить самые профитные монетки, мы рекомендуем вам воспользоваться калькуляторами прибыльности майнинга, которые предоставляют весьма точные расчёты. На данный момент одним из самых популярных калькуляторов подобного типа является известный в кругах майнеров сайт What to Mine

На каких видеокартах выгодно майнить больше всего и какие периоды окупаемости они предлагают на момент написания этой статьи, мы покажем вам в специальной сравнительной таблице дохода майнинга. В расчёте были использованы самые прибыльные криптовалюты и алгоритмы, и для каждой из видеокарт они могли быть разными.

МОДЕЛЬ ВИДЕОКАРТЫСТОИМОСТЬ ВИДЕОКАРТЫ (дол. США)ПРОГНОЗИРУЕМЫЙ ДОХОД ЗА МЕСЯЦ (дол. США)ПЕРИОД ОКУПАЕМОСТИ (в месяцах)
GeForce GTX 1080 Ti11008912.3
GeForce GTX 10808158010.2
GeForce GTX 1070705739.6
GeForce GTX 1060445499
GeForce GTX 1050 Ti220249.2
Radeon RX 5805204511.5
Radeon RX 5704454410.1

Выводы

В этой статье мы рассмотрели лучшие видеокарты для майнинга 2018, которые вы можете использовать для создания своих ферм. Несмотря на то, что многие криптовалюты уходят в сторону PoS майнинга, существует еще огромное количество популярных криптовалют, которые используют PoW и думаю так будет продолжаться еще долго. А какая видеокарта лучше для майнинга по-вашему? Стоит ли майнить? Что вы об этом всем думаете? Напишите в комментариях!

Похожие записи:

  • Лучшие мониторы 2018 года

    3 апреля, 2017

  • Лучшие мышки 2018

    27 апреля, 2017

  • Лучшие корпуса для компьютера 2018

    2 мая, 2017

  • Лучшие компьютеры 2018

    10 июля, 2017

ЭТАЛОНОВ ГРАФИЧЕСКИХ И ЦП ДЛЯ MONERO MINING! ЭТАЛОННЫЕ МАРКИ

GPU И CPU ДЛЯ MONERO MINING! Checkout RandomX Benchmarks для AMD Ryzen, EPYC, Intel, Opteron и Xeon и других.
ЦП Г / с TDP ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ПАРАМ. ОС ДАТА
Тесты Checkout RandomX для графических карт AMD и NVIDIA.
Графический процессор VRAM Г / с TDP ПРОГРАММНОЕ ОБЕСПЕЧЕНИЕ ОС ДАТА

Лучший графический процессор для майнинга Monero в 2021 году

Этот сайт содержит партнерские ссылки на продукты.Мы можем получать комиссию за покупки, сделанные по этим ссылкам. Для получения дополнительной информации см. Наши раскрытия здесь.

Майнинг криптовалют снова стал прибыльным бизнесом. За последние несколько месяцев 2021 года цены на биткойны (BTC) и Ethereum (ETH) взлетели до небес, однако цены на другие криптовалюты также выросли. Одним из них является Monero (XMR), криптовалюта, которая для достижения распределенного консенсуса полагается на майнинг PoW для достижения распределенного консенсуса. В этом кратком руководстве мы рассмотрим лучшие видеокарты для майнинга Monero в 2021 году.

Читайте также: Лучшие процессоры для майнинга Monero в 2021 году

Как ведущая криптовалютная монета, ориентированная на частные и устойчивые к цензуре транзакции, Monero использует криптографию для защиты адресов отправки и получения, а также транзакционных сумм. Однако вознаграждение за майнинг Monero отличается от вознаграждения за биткойн, поскольку установленное вознаграждение за блок Биткойна уменьшается вдвое каждые четыре года, в то время как у Monero есть убывающее вознаграждение за блок, которое постепенно уменьшается с течением времени. Согласно исходу.io, еще одна уникальная особенность Monero заключается в том, что она допускает очень небольшую инфляцию, чтобы гарантировать, что всегда есть бюджет безопасности — то, что Биткойн не поддерживает. В целом, майнинг Monero ничем не отличается от майнинга любой другой криптовалюты. Для этого требуется мощное оборудование, способное выполнять множество вычислений одновременно, и в то же время быть максимально энергоэффективным для получения прибыли.

Для майнинга Monero вы можете использовать процессор (ЦП) или видеокарту.В этой статье мы рассмотрим лучшие видеокарты для майнинга Monero в 2021 году. Некоторые из этих карт способны обеспечивать высокий хешрейт майнинга за счет высокого энергопотребления, в то время как некоторые из них могут предложить хорошую энергоэффективность для более высокая розничная цена. При условии, что вы начнете майнить сегодня, в ближайшем будущем вы можете заработать значительную сумму денег на майнинге Monero, особенно если его цена продолжит расти такими темпами. Однако для этого вам понадобится хорошая видеокарта.Это наш лучший выбор лучших графических процессоров для майнинга Monero в 2021 году.



Тактовая частота с ускорением : 1945 МГц | Память : 8 ГБ GDDR6 | Частота памяти : 14 Гбит / с | Power Разъемы : 2 x 8-контактный | Выходы : 3 x DP, 1 x HDMI


  • Высокий хешрейт при майнинге
  • Очень энергоэффективный
  • Низкое энергопотребление
  • Нет ускорения при трассировке лучей
  • Работает при высоких температурах

Когда дело доходит до майнинга Monero, AMD Radeon RX 5700 XT — одна из лучших видеокарт для этой работы.RX 5700 XT, оснащенный 10300 миллионами транзисторов, способен обеспечить 19,51 TFLOP вычислительной производительности FP16 (половина) и, таким образом, может достичь хешрейта 980 H / s по алгоритму RandomX при общей потребляемой мощности всего 65 Вт. card настолько популярна среди крипто-майнеров, потому что она очень хорошо работает при пониженном напряжении, что означает, что она может обеспечить отличную производительность при меньшем потреблении электроэнергии. Единственным серьезным недостатком этой фантастической видеокарты является то, что она сильно нагревается, поэтому необходимо часто менять ее термический состав, если вы хотите избежать повреждения ядра процессора.

Тактовая частота с ускорением : 1305 МГц | Память : 8 ГБ GDDR5 | Тактовая частота памяти : 8 Гбит / с | Power Разъемы : 1 8-контактный | Выходы : 2 x DP, 2 x HDMI, 1 x DVI-D


  • Очень быстрая окупаемость
  • Достойный хешрейт майнинга
  • Хорошо работает при пониженном напряжении
  • Выдает много тепла
  • Плохие возможности разгона

Хотя AMD Radeon RX 480 теперь является видеокартой 5-летней давности, она по-прежнему впечатляет, особенно когда речь идет о майнинге Monero.По сравнению с более поздней Radeon RX 580, RX 480 немного дешевле и, как таковой, может обеспечить самую быструю окупаемость инвестиций (ROI), если вы решите использовать ее для своих операций по добыче Monero. Radeon RX 480 очень популярен среди майнеров из-за того, что он может быть понижен по напряжению и может обеспечивать те же уровни производительности (если не лучше), что и при стандартных настройках. На практике это означает, что RX 480 может обеспечить хешрейт 470 H / s по алгоритму RandomX при общей потребляемой мощности всего 90 Вт.При этом неудивительно, что эта карта продается как горячие пирожки, когда она есть в наличии.

Тактовая частота с ускорением : 1830 МГц | Память : 6 ГБ GDDR5 | Тактовая частота памяти : 8 Гбит / с | Power Разъемы : 1 8-контактный | Выходы : 3 x DP, 1 x HDMI


  • Быстрая окупаемость
  • Очень хороший хешрейт майнинга
  • Низкое энергопотребление
  • Тихая работа
  • Доступно только с 6 ГБ видеопамяти

Если вы считаете, что Radeon RX 480 слишком старая, и хотите что-то более новое, но все же доступное для майнинга Monero, то подумайте о покупке NVIDIA GeForce GTX 1660.Эта игровая видеокарта среднего уровня с разрешением 1080p — скрытая жемчужина, когда дело доходит до майнинга криптовалют. Он имеет 6 ГБ видеопамяти и требует только один 8-контактный разъем для питания. Благодаря возможности обеспечить хешрейт 530 H / s при общей потребляемой мощности всего 90 Вт, это одна из самых эффективных видеокарт для майнинга Monero. Как и RX 480, GTX 1660 может похвастаться очень быстрой окупаемостью инвестиций, а его розничная цена делает его вполне доступным как для новых, так и для опытных майнеров, несмотря на постоянную нехватку поставок.В целом, GTX 1660 — прекрасная видеокарта для майнинга, и наша единственная жалоба на нее заключается в том, что она не имеет большего количества видеопамяти.

Тактовая частота с ускорением : 1800 МГц | Память : 24 ГБ GDDR6X | Частота памяти : 19,5 Гбит / с | Power Разъемы : 3 x 8-контактный | Выходы : 3 x DP, 1 x HDMI


  • Очень высокий хешрейт майнинга
  • Исключительная производительность вычислений
  • Отлично подходит для 3D-моделирования и рендеринга видео
  • На 35% эффективнее, чем RTX 2080 Ti
  • Требуется блок питания 750 Вт
  • Отсутствуют некоторые функции Titan

Когда дело доходит до майнинга Monero, ничто не может сравниться по мощности с NVIDIA GeForce RTX 3090.Обладая 10 496 единицами затенения, а также 328 тензорными ядрами и ошеломляющими 24 ГБ сверхбыстрой памяти GDDR6X, эта карта может обеспечить хешрейт около 2050 H / s по алгоритму XMRIG 6.7.0 (согласно monerobenchmarks.info). GeForce RTX 3090 также является фантастической картой для майнинга Ethereum, поскольку она может обеспечить хешрейт около 105 MH / s на алгоритме Ethash (Phoenix) и может приносить впечатляющий ежемесячный доход. GeForce RTX 3090 также является отличной игровой видеокартой 4K, а также очень полезна для выполнения сложных задач, таких как 3D-моделирование, рендеринг видео и машинное обучение AI.

Тактовая частота с ускорением : 1785 МГц | Память : 6 ГБ GDDR6 | Частота памяти : 14 Гбит / с | Power Разъемы : 1 8-контактный | Выходы : 1 x DP, 2 x HDMI, 1 x DVI-D


  • Поддерживает трассировку лучей
  • Очень быстрая память
  • Очень энергоэффективная
  • Стоит столько же, сколько некоторые графические процессоры низкого уровня
  • Имеет только 6 ГБ видеопамяти
  • Рентабельность инвестиций может быть лучше

Если вам нужна видеокарта для майнинга, которую вы также будете время от времени использовать в играх, подумайте о приобретении ASUS GeForce RTX 2060 Dual OC EVO.В отличие от других, более премиальных моделей RTX 2060, эта имеет простой и практичный дизайн, а также более доступную цену. Эта карта также полностью поддерживает рендеринг с трассировкой лучей и поддерживает технологию NVIDIA DLSS. Помимо того, что он хорошо подходит для игр, это также довольно приличный графический процессор для майнинга Monero. RTX 2060 может обеспечивать хешрейт 600 H / s при общем энергопотреблении 110 Вт. Такая производительность делает RTX 2060 одной из самых прибыльных карт для майнинга Monero, тем более что она стоит примерно столько же, как GeForce GTX 1660 SUPER. .

Тактовая частота с ускорением : 1645 МГц | Память : 11 ГБ GDDR5X | Частота памяти : 11 Гбит / с | Power Разъемы : 2 x 8-контактный | Выходы : 2 x DP, 2 x HDMI, 1 x DVI-D


  • Невероятно мощный
  • Выдающийся хешрейт майнинга
  • Большой запас для разгона
  • Лучше, чем GeForce RTX 2070
  • Не подходит для майнинга Ethereum
  • Не поддерживает трассировку лучей
  • Очень дорого

И последнее, но не менее важное: GeForce GTX 1080 Ti.Даже сейчас, в 2021 году, это все еще невероятно мощная видеокарта. Хотя у нее нет функций трассировки лучей и она действительно плохо подходит для майнинга Ethereum, эта карта хорошо подходит для игр 4K, а также для майнинга Monero и других альткойнов, таких как Ryo (RYO), Firo (FIRO) и BitTubeCash (TUBE). ). Обладая 11 800 миллионами транзисторов и 11 ГБ видеопамяти GDDR5X, эта карта способна обеспечить хешрейт 1030 H / s по алгоритму RandomX с общим энергопотреблением всего 160 Вт. При такой производительности GTX 1080 Ti по-прежнему остается очень прибыльной. видеокарта для майнинга, несмотря на то, что сейчас она продается по цене 185% от первоначальной рекомендованной розничной цены.В целом, GTX 1080 Ti по-прежнему остается фантастическим графическим процессором, который, несмотря на свои недостатки, будет оставаться актуальным еще некоторое время.

Заключение

Горное дело снова стало очень популярным бизнесом. Помимо Биткойна и Эфириума, есть и другие криптовалюты, которые стоит майнить, например, Monero. Чтобы добыть достаточно блоков Monero и заработать на этом немного денег, вам нужно будет купить мощную видеокарту, которая сможет обеспечить достаточно высокий хешрейт. Некоторые из перечисленных выше видеокарт способны на это.Мы надеемся, что наше руководство по покупке помогло вам найти нужную информацию. Если вы все еще сбиты с толку и нуждаетесь в совете по поводу покупки, не стесняйтесь оставлять комментарии ниже. Мы постараемся вам помочь.

Подробнее

li {font-size: 16px;}. wp-block-advgb-list ul.advgblist-2d6dcad7-3344-47fc-8c83-be7e15443f1b> li {padding-left: 18px; margin-left: 0;}. wp-block -advgb-list ul.advgblist-2d6dcad7-3344-47fc-8c83-be7e15443f1b> li: before {font-size: 16px; color: # 00d084; line-height: 18px; margin: 2px; padding: 2px; margin-left : -20 пикселей}.wp-block-advgb-list ul.advgblist-16ca0372-54da-4803-83a9-0b5a55650d2c> li {font-size: 16px;}. wp-block-advgb-list ul.advgblist-16ca0372-54da-4803-83a9- 0b5a55650d2c> li {padding-left: 18px; margin-left: 0;}. Wp-block-advgb-list ul.advgblist-16ca0372-54da-4803-83a9-0b5a55650d2c> li: before {font-size: 16px; color : # cf2e2e; line-height: 18px; margin: 2px; padding: 2px; margin-left: -20px} .wp-block-advgb-list ul.advgblist-4e4a9daf-3316-4827-b54a-acc507bc4688> li {font -size: 16px;}. wp-block-advgb-list ul.advgblist-4e4a9daf-3316-4827-b54a-acc507bc4688> li {padding-left: 18px; margin-left: 0;}.wp-block-advgb-list ul.advgblist-4e4a9daf-3316-4827-b54a-acc507bc4688> li: before {font-size: 16px; color: # 00d084; line-height: 18px; margin: 2px; padding: 2px; margin-left: -20px} .wp-block-advgb-list ul.advgblist-d9f1811d-8916-472e-9ba4-f600bf6e6d2e> li {font-size: 16px;}. wp-block-advgb-list ul.advgblist- d9f1811d-8916-472e-9ba4-f600bf6e6d2e> li {padding-left: 18px; margin-left: 0;}. wp-block-advgb-list ul.advgblist-d9f1811d-8916-472e-9ba4-f600bf6e6d2e> li {font-size: 16px; color: # cf2e2e; line-height: 18px; margin: 2px; padding: 2px; margin-left: -20px}.wp-block-advgb-list ul.advgblist-c4f99f53-0b58-42cc-ba1d-970729f9a83d> li {font-size: 16px;}. wp-block-advgb-list ul.advgblist-c4f99f53-0b58-42cc-ba1d- 970729f9a83d> li {padding-left: 18px; margin-left: 0;}. Wp-block-advgb-list ul.advgblist-c4f99f53-0b58-42cc-ba1d-970729f9a83d> li: before {font-size: 16px; color : # 00d084; line-height: 18px; margin: 2px; padding: 2px; margin-left: -20px} .wp-block-advgb-list ul.advgblist-58e98dc4-8241-4218-b26f-c8c02872b875> li {font -size: 16px;}. wp-block-advgb-list ul.advgblist-58e98dc4-8241-4218-b26f-c8c02872b875> li {padding-left: 18px; margin-left: 0;}.wp-block-advgb-list ul.advgblist-58e98dc4-8241-4218-b26f-c8c02872b875> li: before {font-size: 16px; color: # cf2e2e; line-height: 18px; margin: 2px; padding: 2px; margin-left: -20px} .wp-block-advgb-list ul.advgblist-33f27521-a37d-44f5-8b36-9a91ca42d483> li {font-size: 16px;}. wp-block-advgb-list ul.advgblist- 33f27521-a37d-44f5-8b36-9a91ca42d483> li {padding-left: 18px; margin-left: 0;}. Wp-block-advgb-list ul.advgblist-33f27521-a37d-44f5-8b36-9a91ca42d483> li: before {font-size: 16px; color: # 00d084; line-height: 18px; margin: 2px; padding: 2px; margin-left: -20px}.wp-block-advgb-list ul.advgblist-67e39f3c-7e78-4e66-ad94-d43e582f922f> li {font-size: 16px;}. wp-block-advgb-list ul.advgblist-67e39f3c-7e78-4e66-ad94- d43e582f922f> li {padding-left: 18px; margin-left: 0;}. wp-block-advgb-list ul.advgblist-67e39f3c-7e78-4e66-ad94-d43e582f922f> li: before {font-size: 16px; color : # cf2e2e; line-height: 18px; margin: 2px; padding: 2px; margin-left: -20px} .wp-block-advgb-list ul.advgblist-cd4225a9-d358-4a86-bf2a-b7d42c6ba65b> li {font -size: 16px;}. wp-block-advgb-list ul.advgblist-cd4225a9-d358-4a86-bf2a-b7d42c6ba65b> li {padding-left: 18px; margin-left: 0;}.wp-block-advgb-list ul.advgblist-cd4225a9-d358-4a86-bf2a-b7d42c6ba65b> li: before {font-size: 16px; color: # 00d084; line-height: 18px; margin: 2px; padding: 2px; margin-left: -20px} .wp-block-advgb-list ul.advgblist-289052ea-9cd5-4bf0-97fe-f99fa22af85f> li {font-size: 16px;}. wp-block-advgb-list ul.advgblist- 289052ea-9cd5-4bf0-97fe-f99fa22af85f> li {padding-left: 18px; margin-left: 0;}. Wp-block-advgb-list ul.advgblist-289052ea-9cd5-4bf0-97fe-f99fa22af85f> li: before {font-size: 16px; color: # cf2e2e; line-height: 18px; margin: 2px; padding: 2px; margin-left: -20px}.wp-block-advgb-list ul.advgblist-e59acb79-9128-4e2f-bc00-fcf72c592bbc> li {font-size: 16px;}. wp-block-advgb-list ul.advgblist-e59acb79-9128-4e2f-bc00- fcf72c592bbc> li {padding-left: 18px; margin-left: 0;}. wp-block-advgb-list ul.advgblist-e59acb79-9128-4e2f-bc00-fcf72c592bbc> li: before {font-size: 16px; color : # 00d084; line-height: 18px; margin: 2px; padding: 2px; margin-left: -20px} .wp-block-advgb-list ul.advgblist-442e00c4-c90d-4322-80c5-29fb19315e9d> li {font -size: 16px;}. wp-block-advgb-list ul.advgblist-442e00c4-c90d-4322-80c5-29fb19315e9d> li {padding-left: 18px; margin-left: 0;}.wp-block-advgb-list ul.advgblist-442e00c4-c90d-4322-80c5-29fb19315e9d> li: before {font-size: 16px; color: # cf2e2e; line-height: 18px; margin: 2px; padding: 2px; margin-left: -20px}]]>

NVIDIA предположительно продала графические процессоры GeForce RTX 30 на сумму 175 миллионов долларов крипто-майнерам

Обновление 28.11.2020 9:15 GMT + 5: Исправленная ссылка на источник.

Видеокарты серии

NVIDIA GeForce RTX 30, основанные на архитектуре графического процессора Ampere, были выпущены в прошлом месяце, и с тех пор их не хватает.Отчеты, поступающие от финансовых аналитиков, предполагают, что NVIDIA продала огромную часть своих игровых графических процессоров Ampere майнерам, что может указывать на то, почему существует огромная нехватка и почему мы не увидим надлежащих розничных поставок до 2021 года.

NVIDIA продала майнерам видеокарты GeForce RTX 30 серии на 175 миллионов долларов, отчет о претензиях

По данным финансовых аналитиков RBC Captial Markets и Barrons, NVIDIA продала майнерам видеокарт GeForce RTX 30 на сумму не менее 175 миллионов долларов, в которых использовались графические процессоры Ampere.В своем отчете о прибылях и убытках за 3 квартал за 21 финансовый год NVIDIA сообщила об очень сильном росте в своем игровом сегменте на 37% в годовом исчислении.

Swappa.com: альтернатива для поиска новых и аккуратно используемых графических процессоров AMD Radeon и NVIDIA GeForce

Компания получила доход в размере 2,27 миллиарда долларов только в игровом сегменте, что означает, что если мы вычтем доход от майнинга, компания фактически заработала 2,1 миллиарда долларов. доходов от игр, но NVIDIA сообщает о продажах майнинга в своем игровом сегменте. Выручка в размере 2,1 миллиарда долларов только от игр по-прежнему ставит NVIDIA в качестве основного сегмента доходов в уходящем квартале.

За отчетный квартал Nvidia продала майнерам Ethereum графические процессоры нового поколения на сумму не менее 175 миллионов долларов, что способствовало росту производительности, согласно записке аналитика RBC Capital Markets Митча Стивса. Аналитик прогнозировал, что объем продаж горнодобывающим предприятиям за квартал составит 150 миллионов долларов.

Стивс отметил, что предстоящее обновление сети блокчейна Ethereum, также известного как Ethereum 2.0, которое запланировано на декабрь, требует от майнеров перехода на более эффективное оборудование для майнинга.Считается, что новые чипы графического процессора Ampere от Nvidia удовлетворят эту потребность.

Биткойн (через TweakTown)

175 миллионов долларов, однако, немалая цифра, и это будет означать, что большая часть графических процессоров серии GeForce RTX 30, предназначенных для игровых целей, была продана майнерам. Спрос со стороны майнингового сообщества растет, поскольку Bitcoin.com предполагает, что Ethereum V2.0 не за горами, и поэтому спрос на более эффективное оборудование увеличился.

До запуска серии GeForce RTX 30 предполагалось, что мы увидим возрождение в сегменте майнинга, что вызовет более высокий спрос на видеокарты и последующий дефицит, который мы наблюдаем сегодня.Продажа NVIDIA напрямую майнерам могла быть объяснена огромным дефицитом на потребительском рынке. Это также говорит о том, что у NVIDIA могла быть лучшая стартовая поставка графических процессоров GeForce RTX 30, даже больше, чем у AMD (у которой по-прежнему было крайне мало карт серии RX 6000, чем у NVIDIA на момент запуска).

В красной команде несколько магазинов и розничных продавцов бойкотировали стартовые продажи, так как не могли получить свои поставки вовремя, и теперь предлагают возобновить поставки на нормальный уровень к 2021 году.Генеральный директор NVIDIA Дженсен Хуанг также сделал аналогичное заявление относительно поставок GeForce RTX 30 серии, в то время как финансовый директор NVIDIA недавно заявил, что потребуется еще несколько месяцев, чтобы предложение догнало спрос.

Приобретение компанией NVIDIA (NVDA) компании Arm Ltd. снова препятствует, поскольку британский CMA отмечает серьезные проблемы с конкуренцией

В целом, быть геймером сейчас действительно отстой, поскольку и NVIDIA, и AMD недооценили огромный спрос на графические процессоры следующего поколения.Геймерам, которые сделали заказ, были показаны даты отгрузки до февраля 2021 года.

NVIDIA и AMD могли бы не торопиться, чтобы увеличить запасы, но они отстают от «беспрецедентного спроса», чтобы справиться с негативной реакцией на выпуск одной из худших видеокарт с точки зрения доступности. С учетом сказанного, мы надеемся, что 2021 год может начаться лучше для геймеров по всему миру, которым просто нужна новая видеокарта, чтобы наслаждаться последними играми.

Обзор

: Nvidia RTX 3080 Ti — мощный двигатель, но удачи вам найти его по рекомендованной цене

долларов США.
  • RTX 3080 Ti.

    Сэм Мачкович

  • Корпус и дизайн с двумя вентиляторами идентичны его собрату без Ti, при этом новая карта весит всего на 8 граммов больше, чем старая.

    Сэм Мачкович

  • Внутренний снимок печатной платы, предоставленный Nvidia.

  • Внутренний снимок печатной платы, предоставленный Nvidia.

  • Три разъема DisplayPort, одно HDMI 2.1.

    Сэм Мачкович

  • Еще раз, серия RTX 3000 просит пользователей либо подключить свой блок питания к проприетарному порту, либо использовать неудобный удлинитель, упакованный в коробку.

    Сэм Мачкович

  • Следовательно, опять же, вам решать, найти в чемодане место для дополнительной выпуклости шнура.

    Сэм Мачкович

Почти девять месяцев назад серия видеокарт Nvidia RTX 3000 была запущена в осажденном мире как кажущийся луч надежды.Первые два графических процессора серии, RTX 3080 и 3070, были почти всем для всех любителей графики. Nvidia построила эти карты на собственном успехе серии RTX 2000 и , добавив на вершину абсолютной, любой мыслимой API возможности растеризации.

Игра, оптимизированная для «RTX», конечно же, отлично работала в первом залпе RTX 3080, но даже без оптимизированной трассировки лучей или впечатляющей передискретизации DLSS она потеряла много ошибок. Поговорите о интересной потенциальной покупке для ботаников, застрявших в доме.

Еще лучше то, что эта мощность сопровождалась более скромными MSRP по сравнению с тем, что мы видели в серии RTX 2000. Как я писал в сентябре 2020 года:

Влияние RTX 3080 на рынок, как мы надеемся, подтолкнет предложение средней стоимости GPU к разумной территории. Его цена в 699 долларов может быть не для вас, но если цены на все, что ниже RTX 3080 (и его родного брата, RTX 3070, запуск которого запланирован на октябрь на уровне 499 долларов), скорректируются в соответствии с приведенными ниже контрольными показателями, это означает, что Графический процессор 1080p или 1440p может наконец оказаться в пределах вашего бюджета.

… ну да. Об этом …

В то время я был слишком занят проведением тестов, чтобы спрашивать свой хрустальный шар о неминуемом будущем взрыва криптовалютных ценностей и сокращения поставок микросхем и кремния. Рынок видеокарт пошел на убыль, и это оставило меня в руках смехотворных заявлений о будущих ценах на графические процессоры. Любой, кто обращал внимание, был свидетелем множества мгновенных распродаж графических процессоров и ошеломляющих списков на eBay.

Тем не менее, каким-то образом, несмотря на то, что существующие карты этой серии уже трудно отследить, серия Nvidia RTX 3000 продолжает расширять — как видно из недавнего анонса двух новых моделей, RTX 3080 Ti и RTX 3070 Ti, которые запускаются. по рекомендованной рекомендованной производителем цене 1199 и 599 долларов соответственно.(Когда фанаты просили вас сделать больше видеокарт, Nvidia, я не уверен, что они имели в виду именно это.)

Если вы удивлены этой новостью, значит, вы не одиноки. На прошлой неделе я узнал о новых моделях благодаря неожиданному стуку в дверь и 11-фунтовой коробке, упакованной по одному из каждого нового графического процессора, предоставленного Nvidia. Это первый раз, когда я могу вспомнить, как получил образец видеокарты от поставщика без электронного письма с уведомлением о том, что я должен подготовить сетку на своем крыльце, чтобы поймать нетерпеливых воров, занимающихся добычей криптовалют.

Реклама

Звездочка размером с астероид, как обычно

Сегодня снято эмбарго на обзоры 3080 Ti. И, поскольку это становится все более распространенным в Ars, в этом обзоре есть звездочка размером с астероид, которая, вероятно, разрушит ваши надежды на покупку этой карты в ближайшем будущем. Nvidia не рассказывала об усилиях компании по стабилизации поставок и не пыталась гарантировать, что реальные люди смогут купить RTX 3080 Ti, начиная с завтрашнего дня, 3 июня, «по цене» 1199 долларов.Остается только догадываться, когда и как такой кроткий технический энтузиаст, как вы, получит справедливое потрясение на текущем рынке.

  • Характеристики RTX 3080 Ti, предоставленные Nvidia в сравнении с RTX 2080 Ti. Более важное сравнение касается RTX 3080 FE, которую вы найдете на следующем слайде.

  • 3080 Ti превосходит прошлогодний RTX 3080 практически во всех категориях: на 1536 ядер CUDA больше, на 48 тензорных ядер; Еще 22 ядра RT; 152GB / s больше пропускная способность памяти; и на 2 ГБ больше оперативной памяти GDDR6X.Тактовая частота ускорения по умолчанию достигает максимума намного медленнее, на 35 МГц.

Если есть реальная возможность купить эту поверхность карты, я могу сказать, что RTX 3080 Ti завершает то, что было начато RTX 3080, по крайней мере, для этого поколения графических процессоров. Его прирост по сравнению с 3080 интересен: он существенный, но не обязательно стоит еще 400 долларов по рекомендованной рекомендованной производителем цене. Но с чисто игровой точки зрения новая карта на этой неделе делает RTX 3090 и его рекомендованную цену в 1499 долларов абсолютно спорной.

Спецификации RTX 3080 Ti ближе к 3090, чем 3080, с самой большой разницей в виде пропасти VRAM. У этой карты на 2 ГБ больше, чем у 3080, но на колоссальные 12 ГБ меньше, чем у 3090. Это большая разница в видеопамяти, но между приведенной выше таблицей спецификаций и приведенными ниже результатами производительности 3080 Ti явно лучший выбор, чем 3090, если она высока. res games — приоритет вашего графического процессора.

Это имеет смысл, поскольку 3090 была демонстрационной картой VRAM, идеальной либо в качестве варианта начального уровня для редактирования видео высокого класса, либо в качестве чего-то, что можно было бы прикрепить к дисплею 8K.Если вы не попадаете ни в один из этих лагерей, будьте уверены, что 3080 Ti — лучший вариант для перерасхода ресурсов графического процессора, особенно когда ваша система настроена на игры с Rev. с разрешением 4K и стабильной частотой кадров с очень небольшими компромиссами. Между тем, если «только 12 ГБ видеопамяти GDDR6X» — это предложение, которое вы могли бы произнести вслух, когда слеза выпала из слезного канала обработки видео, RTX 3080 Ti, скорее всего, вас не очарует.

Идентичная сборка, с одним заметным отличием

Набор тестов Enlarge / 3DMark, включая тест Port Royal с интенсивным использованием RT, является хорошей отправной точкой для сравнений, хотя последние карты AMD в некоторых случаях использования выигрывают больше, чем это может предполагаться.По крайней мере, они показывают небольшой разрыв между 3080 Ti и 3090.

RTX 3080 прошлого года, конечно, не рубленая печень. Если вы найдете любую вещь между 3080 и 3090 по цене, близкой к MSRP, и хотите заполнить свой любимый 4K-дисплей как можно большим количеством пикселей, купите сначала и задайте вопросы о номере модели позже. В зависимости от вашего идеального варианта использования вы можете добавить AMD RX 6800XT в этот список идеальных высокопроизводительных графических процессоров, поскольку он все еще имеет значительные победы в нашей серии тестов.Но новый 3080 Ti отлично справляется с против всех высококлассных опций, перечисленных в этом абзаце (особенно, если цена для вас является полностью произвольной концепцией; на этом рынке это, к сожалению, вероятно).

Реклама

Я получил выпущенную Nvidia «Founders Edition» модели 3080 Ti, и ее физический корпус и конструкция вентилятора выглядят идентичными 3080 вплоть до сборки с двумя вентиляторами и «продувочного» процесса охлаждения.Но одно на этот раз определенно изменилось — это шум.

Я тестировал каждую версию RTX 3000 Founders Edition до этого момента, и большинство из них проделали огромную работу по уравновешиванию тепла, воздушного потока и скорости вращения вентилятора для эффективной работы и бесшумно. Такие вещи редко доводят своих поклонников до крайности. Но физическая структура 3080 Ti вмещает более плотно упакованную плату микросхем, при этом потребляемая мощность по умолчанию увеличивается с 320 Вт до 350 Вт. Это означает, что толчок пришел к увеличению децибел с точки зрения сохранения производительности и охлаждения этого графического процессора.

Чтобы уточнить, уровень децибел 3080 Ti не превышает его не-Ti собрата. Скорее, выигрыш 3080 Ti достигается за счет повышенной вероятности того, что его вентиляторы будут увеличивать обороты при настройках по умолчанию, вызванных тем, что кажется пороговым значением 81 ° C.

Средний прирост после 3080: 10-12%

  • В общем, тесты говорят сами за себя в этой галерее тестов без RT.Некоторые более старые тесты не включают цифру «1% минимум», объясненную в тексте ниже.

  • Hitman 3 Тест Dartmoor включает в себя последовательность загрузки ЦП, поэтому показатели 1% так низки по всем направлениям.

  • Стоит отметить: MSFS 2020 остается особенно нестабильной игрой для тестирования, независимо от того, насколько я контролирую ее параметры тестирования, и, следовательно, ее «1%» здесь не заслуживают доверия сверху вниз.Мне приходилось повторно запускать каждый тест много раз из-за случайных скачков, связанных с процессором, и это самые стабильные результаты, которые я мог получить.

Для этого обзора мои сравнительные тесты сравнивают 3080 Ti с двумя его ближайшими соседями: 3080 и AMD RX 6800XT (рекомендованная цена: 649 долларов). Я нанял старшего технологического редактора Ars Ли Хатчинсона для участия в нескольких тестах RTX 3090 FE, связанных с графическим процессором, но они проводились на другом оборудовании.Таким образом, результаты RTX 3090 FE появляются только в выборочных тестах.

Все более слабые карты в моих таблицах были протестированы на той же установке, которая имеет процессор Intel i7-8700K, разогнанный до 4,6 ГГц, 32 ГБ оперативной памяти DDR4-3000, блок питания на 850 Вт и SSD-накопитель. Эти тесты проводились в более ранних обзорах старых драйверов, поэтому их подсчеты сопровождаются небольшим предупреждением о допуске погрешности.

Самая легкая часть обзора — подтвердить, что 3080 Ti превосходит 3080 по всем параметрам. В редких случаях выигрыш по сравнению с 3080 невелик: производительность Gears 5 4K у двух карт почти одинакова, а при падении разрешения с 4K до 1440p (как и следовало ожидать в сценариях с меньшей ограниченностью ЦП) выигрыш ниже.Но обычно выигрыш приближается к 10-12 процентам.

Кроме того, отличная статистика 3080 Ti не достигается за счет нестабильности частоты кадров. Я отслеживал большинство тестов с помощью подсчета частоты кадров MSI Afterburner «на один процент ниже», и эта трудоемкая перепроверка дает ответ на важный вопрос: сопровождается ли указанная средняя частота кадров скрытыми всплесками времени кадра. Как видно из приведенной выше статистики, эта карта остается в силе. (ЦП моего тестового стенда становится немного длинноватым, поэтому ваша однопроцентная статистика с использованием любого из этих графических процессоров может выглядеть даже лучше, чем моя.)

Лучшие видеокарты — август 2021 г.

1 NVIDIA GeForce RTX 3090 DirectX 12.00

1499 долл. США

19970

13

10.2

2 NVIDIA GeForce RTX 3080 Ti DirectX 12.00

1199 долл. США

19573

16

0.5

3 AMD Radeon 6900 XT DirectX 12.00

999 долл. США

19167

19

4.2

4 AMD Radeon RX 6800 XT DirectX 12.00

649 долл. США

18217

28 год

3.6

5 NVIDIA Quadro RTX A6000 DirectX 12.00

нет данных

17904

нет данных

0.0

6 NVIDIA GeForce RTX 3080 DirectX 12.00

699 долл. США

17699

25

14.7

7 AMD Radeon RX 6800 DirectX 12.00

579 долл. США

15217

26 год

1.3

8 NVIDIA Titan RTX DirectX 12.00

2499 долл. США

15014

6

0.0

9 NVIDIA GeForce RTX 2080 Ti DirectX 12.00

999 долл. США

14829

14

3.1

10 NVIDIA GeForce RTX 3070 Ti DirectX 12.00

599 долл. США

14825

24

0.1

11 NVIDIA Quadro RTX 6000 DirectX 12.00

6299 долл. США

13897

2

0.0

12 NVIDIA GeForce RTX 3070 DirectX 12.00

499 долл. США

13722

27

10.1

13 NVIDIA Titan V DirectX 12.00

2999 долл. США

12986

4

0.0

14 AMD Radeon RX 6700 XT DirectX 12.00

нет данных

11986

нет данных

0.9

15 NVIDIA GeForce RTX 3060 Ti DirectX 12.00

399 долл. США

11833

29

2.1

16 NVIDIA GeForce RTX 3080 (ноутбук) DirectX 12.00

нет данных

11755

нет данных

0.8

17 NVIDIA GeForce RTX 2080 СУПЕР DirectX 12.00

699 долл. США

11670

16

1.8

18 NVIDIA GeForce RTX 2080 DirectX 12.00

699 долл. США

11091

15

1.6

19 NVIDIA Quadro RTX 5000 DirectX 12.00

2299 долл. США

10747

4

0.0

20 NVIDIA GeForce RTX 2080 SUPER (ноутбук) DirectX 12.00

нет данных

10476

нет данных

0.2

21 NVIDIA GeForce RTX 3070 (ноутбук) DirectX 12.00

нет данных

10437

нет данных

1.7

22 NVIDIA Titan Xp DirectX 12.00

1199 долл. США

10342

8

0.0

23 NVIDIA GeForce RTX 2070 СУПЕР DirectX 12.00

499 долл. США

10199

20

3.3

24 NVIDIA GeForce RTX 2080 (ноутбук) DirectX 12.00

нет данных

10102

нет данных

0.2

25 Коллекционное издание NVIDIA Titan Xp DirectX 12.00

1199 долл. США

10100

8

0.0

26 NVIDIA GeForce GTX 1080 Ti DirectX 12.00

699 долл. США

9946

14

2.7

27 NVIDIA Titan X (Паскаль) DirectX 12.00

1199 долл. США

9782

8

0.1

28 AMD Radeon RX 5700 XT DirectX 12.00

399 долл. США

9461

23

3.1

29 NVIDIA GeForce RTX 2070 DirectX 12.00

499 долл. США

9125

18

1.7

30 AMD Radeon VII DirectX 12.00

699 долл. США

8889

12

0.1

31 NVIDIA GeForce RTX 3060 DirectX 12.00

329 долл. США

8840

26 год

0.9

32 NVIDIA GeForce RTX 2060 СУПЕР DirectX 12.00

399 долл. США

8813

22

1.1

33 NVIDIA GeForce RTX 2080 СУПЕР Макс-Q DirectX 12.00

нет данных

8685

нет данных

0.1

34 NVIDIA GeForce RTX 2070 SUPER (ноутбук) DirectX 12.00

нет данных

8539

нет данных

0.3

35 AMD Radeon RX 5700 DirectX 12.00

349 долл. США

8367

23

0.3

36 NVIDIA GeForce RTX 3060 (ноутбук) DirectX 12.00

нет данных

8279

нет данных

1.1

37 NVIDIA GeForce RTX 2080 Макс-Q DirectX 12.00

нет данных

8050

нет данных

0.1

38 NVIDIA Quadro RTX 4000 DirectX 12.00

899 долл. США

7847

8

0.0

39 NVIDIA Quadro RTX 5000 Макс-Q DirectX 12.00

нет данных

7832

нет данных

0.0

40 NVIDIA GeForce RTX 2070 (обновление для ноутбуков) DirectX 12.00

нет данных

7783

нет данных

0.3

41 NVIDIA GeForce RTX 2070 СУПЕР Макс-Q DirectX 12.00

нет данных

7637

нет данных

0.1

42 NVIDIA GeForce RTX 2060 DirectX 12.00

349 долл. США

7592

21 год

1.8

43 NVIDIA GeForce GTX 1080 DirectX 12.00

599 долл. США

7584

12

2.2

44 AMD Radeon RX 5600 XT DirectX 12.00

279 долл. США

7578

27

0.6

45 NVIDIA GeForce RTX 2070 (ноутбук) DirectX 12.00

нет данных

7563

нет данных

0.2

46 NVIDIA Quadro RTX 4000 (ноутбук) DirectX 12.00

нет данных

7438

нет данных

0.0

47 AMD Radeon RX Vega 64 DirectX 12.00

499 долл. США

7396

14

0.7

48 NVIDIA GeForce GTX 1080 (ноутбук) DirectX 12.00

нет данных

7121

нет данных

0.1

49 NVIDIA GeForce RTX 2070 Макс-Q DirectX 12.00

нет данных

7054

нет данных

0.2

50 AMD Radeon Vega Frontier Edition DirectX 12.00

999 долл. США

6919

6

0.0

51 AMD Radeon RX Vega 56 DirectX 12.00

399 долл. США

6832

17

0.4

52 NVIDIA GeForce GTX 1070 Ti DirectX 12.00

399 долл. США

6825

17

0.8

53 NVIDIA GeForce RTX 2070 Max-Q (обновить) DirectX 12.00

нет данных

6784

нет данных

0.1

54 NVIDIA GeForce GTX 1660 Ti DirectX 12.00

279 долл. США

6379

22

0.6

55 NVIDIA GeForce RTX 2060 (обновление ноутбука) DirectX 12.00

нет данных

6301

нет данных

0.7

56 NVIDIA GeForce GTX 1660 СУПЕР DirectX 12.00

229 долл. США

6089

26 год

1.3

57 NVIDIA GeForce GTX 1070 DirectX 12.00

379 долл. США

6083

16

2.1

58 NVIDIA Quadro P5000 DirectX 12.00

2499 долл. США

6023

2

0.0

59 NVIDIA GeForce RTX 2060 (ноутбук) DirectX 12.00

нет данных

6019

нет данных

0.3

60 NVIDIA GeForce GTX 1080 Макс-Q DirectX 12.00

нет данных

5961

нет данных

0.0

61 NVIDIA GeForce GTX 980 Ti DirectX 12.00

649 долл. США

5802

8

0.5

62 NVIDIA GeForce RTX 2060 Макс-Q DirectX 12.00

нет данных

5660

нет данных

0.1

63 NVIDIA GeForce GTX 1660 Ti (ноутбук) DirectX 12.00

нет данных

5622

нет данных

0.4

64 AMD Radeon RX 5600M DirectX 12.00

нет данных

5596

нет данных

0.0

65 NVIDIA GeForce GTX 1070 (ноутбук) DirectX 12.00

нет данных

5575

нет данных

0.2

66 NVIDIA GeForce GTX 1660 DirectX 12.00

219 долл. США

5469

24

0.5

67 NVIDIA GTX ТИТАН X DirectX 12.00

999 долл. США

5444

5

0.1

68 NVIDIA GeForce RTX 3050 Ti (ноутбук) DirectX 12.00

нет данных

5356

нет данных

0.0

69 AMD Radeon R9 Ярость X DirectX 12.00

649 долл. США

5141

7

0.0

70 NVIDIA GeForce GTX 1660 Ti Max-Q; DirectX 12.00

нет данных

5011

нет данных

0.1

71 NVIDIA Quadro P4000 DirectX 12.00

815 долл. США

4917

6

0.0

72 AMD Radeon RX 5500 XT DirectX 12.00

169 долл. США

4870

28 год

0.3

73 NVIDIA GeForce GTX 1070 Макс-Q DirectX 12.00

нет данных

4843

нет данных

0.0

74 AMD Radeon R9 Fury DirectX 12.00

549 долл. США

4747

8

0.0

75 NVIDIA GeForce GTX 1650 СУПЕР DirectX 12.00

160 долларов США

4716

29

0.4

76 AMD Radeon RX 590 DirectX 12.00

279 долл. США

4703

16

0.3

77 AMD Radeon R9 Nano DirectX 12.00

649 долл. США

4626

7

0.0

78 AMD Radeon RX 5500M DirectX 12.00

нет данных

4396

нет данных

0.0

79 NVIDIA GeForce GTX 980 DirectX 12.00

549 долл. США

4383

7

0.3

80 AMD Radeon RX 580 DirectX 12.00

229 долл. США

4294

18

1.3

81 AMD Radeon R9 390X DirectX 12.00

429 долл. США

4253

9

0.0

82 NVIDIA GeForce GTX 1060-6 ГБ DirectX 12.00

299 долларов США

4183

13

1.7

83 AMD Radeon RX 480 DirectX 12.00

229 долл. США

4087

17

0.3

84 AMD Radeon R9 290X DirectX 12.00

549 долл. США

3991

7

0.1

85 AMD Radeon R9 390 DirectX 12.00

329 долл. США

3956

12

0.1

86 NVIDIA GeForce GTX 1060-5 ГБ DirectX 12.00

нет данных

3905

нет данных

0.0

87 AMD Radeon RX 580 2048SP DirectX 12.00

нет данных

3852

нет данных

0.1

88 NVIDIA GeForce GTX 1060-3 ГБ DirectX 12.00

199 долларов США

3834

19

0.6

89 AMD Radeon RX 570 DirectX 12.00

169 долл. США

3812

22

0.8

90 AMD Radeon R9 290; DirectX 12.00

399 долл. США

3713

9

0.1

91 NVIDIA GeForce GTX 1650 Ti (ноутбук) DirectX 12.00

нет данных

3692

нет данных

0.2

92 NVIDIA GeForce GTX 1060 (ноутбук) DirectX 12.00

нет данных

3687

нет данных

0.2

93 NVIDIA GeForce GTX 970 DirectX 12.00

329 долл. США

3659

11

0.9

94 NVIDIA GeForce GTX 1650 DirectX 12.00

149 долларов США

3649

24

0.5

95 AMD Radeon RX 470 DirectX 12.00

179 долларов США

3643

20

0.2

96 NVIDIA GeForce GTX 1650 (ноутбук) DirectX 12.00

нет данных

3451

нет данных

0.3

97 NVIDIA GeForce GTX 1060 Макс-Q DirectX 12.00

нет данных

3419

нет данных

0.1

98 NVIDIA Quadro P2200 DirectX 12.00

нет данных

3411

нет данных

0.0

99 NVIDIA GeForce GTX 780 Ti DirectX 12.00

699 долл. США

3396

4

0.0

100 NVIDIA Quadro T2000 (ноутбук) DirectX 12.00

нет данных

3319

нет данных

0.0

101 NVIDIA GeForce GTX 1650 Ti Max-Q; DirectX 12.00

нет данных

3162

нет данных

0.0

102 NVIDIA GeForce GTX Titan Черный DirectX 12.00

999 долл. США

3160

3

0.0

103 AMD Radeon R9 380X DirectX 12.00

229 долл. США

3046

13

0.0

104 NVIDIA Quadro P2000 DirectX 12.00

585 долларов США

2977

5

0.0

105 NVIDIA GeForce GTX 980M DirectX 12.00

нет данных

2932

нет данных

0.0

106 NVIDIA GeForce GTX 1650 Max-Q; DirectX 12.00

нет данных

2930

нет данных

0.0

107 Графика AMD Radeon RX Vega M GH DirectX 12.00

нет данных

2899

нет данных

0.0

108 NVIDIA GeForce GTX Титан DirectX 12.00

999 долл. США

2885

2

0.0

109 NVIDIA GeForce GTX 780 DirectX 12.00

649 долл. США

2844

4

0.1

110 AMD Radeon R9 380 DirectX 12.00

199 долларов США

2783

13

0.0

111 AMD Radeon R9 285; DirectX 12.00

249 долл. США

2758

11

0.0

112 NVIDIA GeForce GTX 1050 Ti DirectX 12.00

139 долларов США

2356

16

0.8

113 NVIDIA GeForce GTX 1050 Ti (ноутбук) DirectX 12.00

нет данных

2348

нет данных

0.1

114 AMD Radeon R9 280X DirectX 12.00

299 долларов США

2332

7

0.1

115 NVIDIA Quadro M4000 DirectX 12.00

791 долл. США

2312

2

0.0

116 NVIDIA GeForce GTX 960 DirectX 12.00

199 долларов США

2308

11

0.3

117 NVIDIA GeForce GTX 970M DirectX 12.00

нет данных

2282

нет данных

0.0

118 AMD Radeon HD 7970 DirectX 12.00

549 долл. США

2282

4

0.0

119 NVIDIA GeForce GTX 1050 Макс-Q DirectX 12.00

нет данных

2192

нет данных

0.0

120 NVIDIA GeForce GTX 770 DirectX 12.00

399 долл. США

2158

5

0.1

121 NVIDIA GeForce GTX 1050 (Ноутбук) DirectX 12.00

нет данных

2095

нет данных

0.0

122 Графика AMD Radeon RX Vega M GL DirectX 12.00

нет данных

2089

нет данных

0.0

123 NVIDIA GeForce GTX 680 DirectX 12.00

499 долл. США

2019 г.

4

0.0

124 AMD Radeon R9 280 DirectX 12.00

279 долл. США

2019 г.

7

0.0

125 NVIDIA GeForce GTX 950 DirectX 12.00

159 долларов США

1922 г.

12

0.1

126 AMD Radeon HD 7950; DirectX 12.00

449 долл. США

1916 г.

4

0.0

127 NVIDIA GeForce GTX 670 DirectX 12.00

399 долл. США

1856 г.

4

0.0

128 AMD Radeon RX 560X (ноутбук) DirectX 12.00

нет данных

1849 г.

нет данных

0.0

129 AMD Radeon RX 560 DirectX 12.00

99 долларов США

1840 г.

18

0.1

130 NVIDIA GeForce GTX 965M DirectX 12.00

нет данных

1809 г.

нет данных

0.0

131 AMD Radeon R9 270X DirectX 12.00

199 долларов США

1763

8

0.0

132 AMD Radeon RX 460 DirectX 12.00

86 долл. США

1739 г.

20

0.0

133 NVIDIA GeForce GTX 1050 DirectX 12.00

109 долларов США

1738

15

0.2

134 NVIDIA GeForce GTX 760 DirectX 12.00

249 долл. США

1690

6

0.1

135 AMD Radeon HD 7870 DirectX 12.00

412 долл. США

1650

4

0.0

136 NVIDIA GeForce GTX 660 Ti DirectX 12.00

299 долларов США

1639

5

0.0

137 NVIDIA GeForce GTX 880M DirectX 12.00

нет данных

1607

нет данных

0.0

138 AMD Radeon R9 270 DirectX 12.00

179 долларов США

1601

8

0.0

139 AMD Radeon R7 260X DirectX 12.00

139 долларов США

1510

10

0.0

140 AMD Radeon R7 370 DirectX 12.00

149 долларов США

1492

10

0.0

141 NVIDIA GeForce GTX 780M DirectX 12.00

нет данных

1466

нет данных

0.0

142 AMD Radeon RX Vega 8 (Ryzen 4000) DirectX 12.00

нет данных

1436

нет данных

0.0

143 AMD Radeon R7 360 DirectX 12.00

109 долларов США

1406

12

0.0

144 NVIDIA GeForce GTX 870M DirectX 12.00

нет данных

1336

нет данных

0.0

145 NVIDIA GeForce GTX 660 DirectX 12.00

229 долл. США

1323

5

0.1

146 AMD Radeon HD 7850; DirectX 12.00

249 долл. США

1316

5

0.0

147 AMD Radeon RX Vega 7 (Ryzen 4000) DirectX 12.00

нет данных

1294

нет данных

0.0

148 Графика Intel Iris Xe G7 96EU DirectX 12.00

нет данных

1288

нет данных

0.1

149 NVIDIA GeForce GTX 750 Ti DirectX 12.00

149 долларов США

1285

8

0.1

150 Графика Intel Iris Xe G7 80EU DirectX 12.00

нет данных

1248

нет данных

0.0

151 NVIDIA GeForce GTX 960M DirectX 12.00

нет данных

1240

нет данных

0.1

152 AMD Radeon RX Vega 11 (мобильная) DirectX 12.00

нет данных

1213

нет данных

0.1

153 AMD Radeon RX 550 DirectX 12.00

79 долларов США

1193

15

0.1

154 NVIDIA Quadro K2200 DirectX 12.00

395 долл. США

1193

3

0.0

155 NVIDIA GeForce GTX 860M DirectX 12.00

нет данных

1156

нет данных

0.0

156 NVIDIA GeForce GTX 650 Ti Boost DirectX 12.00

169 долл. США

1124

6

0.0

157 NVIDIA GeForce GT 1030 DirectX 12.00

79 долларов США

1091

13

0.1

158 NVIDIA GeForce MX250 (25 Вт) DirectX 12.00

нет данных

1082

нет данных

0.0

159 AMD Radeon RX Vega 7 (Ryzen 4000 Mobile) DirectX 12.00

нет данных

1067

нет данных

0.0

160 NVIDIA GeForce GTX 750 DirectX 12.00

119 долларов США

1058

8

0.0

161 NVIDIA GeForce MX150 DirectX 12.00

нет данных

996

нет данных

0.0

162 NVIDIA GeForce 950M DirectX 12.00

нет данных

989

нет данных

0.0

163 NVIDIA GeForce GTX 850M DirectX 12.00

нет данных

983

нет данных

0.0

164 NVIDIA GeForce GTX 770M DirectX 12.00

нет данных

964

нет данных

0.0

165 AMD Radeon Vega 6 Mobile DirectX 12.00

нет данных

921

нет данных

0.0

166 NVIDIA GeForce GTX 650 Ti DirectX 12.00

149 долларов США

906

6

0.0

167 AMD Radeon RX Vega 5 (Ryzen 4000 Mobile) DirectX 12.00

нет данных

890

нет данных

0.0

168 AMD Radeon Vega 6 DirectX 12.00

нет данных

889

нет данных

0.0

169 AMD Radeon Vega 10 Mobile DirectX 12.00

нет данных

850

нет данных

0.0

170 Intel Iris Pro Graphics 10-го поколения для мобильных устройств DirectX 12.00

нет данных

771

нет данных

0.0

171 NVIDIA GeForce GTX 765M DirectX 12.00

нет данных

759

нет данных

0.0

172 AMD Radeon HD 7770 DirectX 12.00

130 долл. США

711

5

0.0

173 Intel UHD Graphics 750 (настольный компьютер 11-го поколения) DirectX 12.00

нет данных

661

нет данных

0.0

174 NVIDIA GeForce GTX 745 DirectX 12.00

нет данных

656

нет данных

0.0

175 NVIDIA GeForce MX130 DirectX 12.00

нет данных

645

нет данных

0.0

176 NVIDIA GeForce GT 1030 (DDR4) DirectX 12.00

нет данных

640

нет данных

0.0

177 NVIDIA GeForce 940MX DirectX 12.00

нет данных

599

нет данных

0.0

178 NVIDIA GeForce GTX 650 DirectX 12.00

109 долларов США

545

5

0.0

179 NVIDIA GeForce 940M DirectX 12.00

нет данных

514

нет данных

0.0

180 NVIDIA GeForce GT 740 DirectX 12.00

89 долл. США

513

5

0.0

181 NVIDIA GeForce 840M DirectX 12.00

нет данных

500

нет данных

0.0

182 NVIDIA GeForce GT 750M DirectX 12.00

нет данных

461

нет данных

0.0

183 Intel UHD Графика 630 DirectX 12.00

нет данных

449

нет данных

0.0

184 NVIDIA GeForce GT 650M DirectX 12.00

нет данных

414

нет данных

0.0

185 NVIDIA GeForce GT 640 (DDR3) DirectX 12.00

99 долларов США

410

4

0.0

186 AMD Radeon Vega 3 DirectX 12.00

нет данных

408

нет данных

0.0

187 Intel HD графика 630 DirectX 12.00

нет данных

408

нет данных

0.0

188 Intel UHD Graphics 10-го поколения для мобильных устройств DirectX 12.00

нет данных

384

нет данных

0.0

189 Intel HD Графика 530 DirectX 12.00

нет данных

381

нет данных

0.0

190 Intel HD Graphics 630 (мобильная) DirectX 12.00

нет данных

368

нет данных

0.0

191 Intel UHD Графика 620 DirectX 12.00

нет данных

355

нет данных

0.0

192 NVIDIA GeForce GT 740M DirectX 12.00

нет данных

345

нет данных

0.0

193 Intel HD графика 620 DirectX 12.00

нет данных

335

нет данных

0.0

194 Графика Intel Iris 520 DirectX 12.00

нет данных

313

нет данных

0.0

195 NVIDIA GeForce GT 730 DirectX 12.00

59 долларов США

299

5

0.0

196 Intel HD Графика 5500 DirectX 12.00

нет данных

234

нет данных

0.0

197 NVIDIA GeForce GT 710 DirectX 12.00

34 доллара США

200

5

0.0

198 Intel HD Графика 4600 DirectX 12.00

нет данных

194

нет данных

0.0

199 NVIDIA GeForce GT 630 DirectX 12.00

99 долларов США

166

1

0.0

Главная страница графических карт, видеокарт, графических процессоров

GALAX перевыпускает видеокарты GeForce RTX 3090 и RTX 3080 с кулерами нагнетательного типа

Процессоры AMD Zen4 Ryzen подтвердили наличие встроенной графики

AMD Radeon RX 6600 не- Моделирование производительности XT очень близко к GeForce RTX 3060

AMD 3D V-Cache использует связи с шагом 9 микрон, будущее 3D-стекирования — это нарезка цепей

Samsung планирует 8-стековые модули памяти TSV DDR5 с общей емкостью до 512 ГБ

Процессор Intel Core i9-12900K обнаружен вместе с материнской платой ASUS ROG Strix Z690-E

Утечка целых наборов микросхем Intel серии 600 для процессоров Alder Lake, также указан X699 HEDT

Архитектура AMD RDNA4, по слухам, будет построена с использованием узлов 3 и 5 нм

Чип Tesla D1 содержит 50 миллиардов транзисторов, масштабируется до 1.1 ExaFLOPS с ExaPOD

Геймер находит подставку для пальца под термопрокладкой GeForce RTX 3090 Founders Edition

Платформа AMD AM5 для утечек «Raphael», подтверждающая поддержку PCIe Gen4, двухканальная память DDR5

Проект Intel Royal Core для повышения эффективности архитектуры x86

(PR) Alphacool бесплатно раздает кронштейны Intel LGA1700 / 4189 для своих кулеров AIO.

Call of Duty: Vanguard: шутер о Второй мировой войне запускается 5 ноября.

Технология суперсэмплинга на базе Intel XeSS AI будет открыта, как только она вырастет.

Графический процессор Intel Xe-HPC Ponte Vecchio с поддержкой до 128 ядер Xe и 128 модулей трассировки лучей

Intel Alder Lake для обеспечения производительности и эффективности ядер, представил планировщик Intel Thread Director

Battlefield 2042 бесплатно с некоторыми видеокартами GeForce RTX 30

Intel представляет план развития графики ARC, процессоров Xe-Core и технологии сверхвысокого разрешения XeSS

Генеральный директор NVIDIA Дженсен Хуанг exp устраняет ограничения на поставку в течение большей части следующего года.

DLSS Swapper позволяет вручную обновлять библиотеку сверхвысокого разрешения NVIDIA в любой игре.

Intel подтверждает, что графические процессоры Arc Alchemist DG2 будут поддерживать DisplayPort 2.0

Intel Core i9 «Raptor Lake-S» с 24 ядрами, полная линейка просочилась

AMD Radeon RX 7600 / RX 7500 серии следующего поколения может использовать обновленные 6-нм графические процессоры Navi 2X

(PR) MSI & EK объявляют Материнская плата AMD X570S MPG Carbon EK X с предустановленным моноблоком

AMD Ryzen Threadripper 5000 «Шагал» с архитектурой Zen3 с поддержкой до 64 ядер

(PR) TeamGroup запускает память T-Force Delta RGB DDR5 со скоростью до 5600 МТ / с

(PR) MSI представляет AMD X570S MEG, MPG и MAG и серию материнских плат

Myst для Xbox с поддержкой AMD FidelityFX Super Resolution при запуске

(PR) PNY объявляет, что ее память XLR8 Gaming DDR5-4800 будет доступна в четвертом квартале. из 2021

Лучшие графические процессоры для глубокого обучения в 2020 году — углубленный анализ

Глубокое обучение — это область с высокими вычислительными требованиями, и ваш выбор графического процессора в значительной степени определит ваши ожидания от глубокого обучения риенс.Но какие функции важны, если вы хотите купить новый графический процессор? GPU RAM, ядра, тензорные ядра? Как сделать рентабельный выбор? В этом сообщении блога мы углубимся в эти вопросы, рассмотрим распространенные заблуждения, дадим вам интуитивное понимание того, как думать о графических процессорах, и дадим вам совет, который поможет вам сделать правильный выбор.

Этот пост в блоге разработан, чтобы дать вам различные уровни понимания графических процессоров и новых графических процессоров серии Ampere от NVIDIA. У вас есть выбор: (1) Если вас не интересуют подробности того, как работают графические процессоры, что делает графический процессор быстрым и что уникального в новой серии NVIDIA RTX 30 ампер, вы можете сразу перейти к производительности и производительности на долларовые графики и раздел рекомендаций.Они составляют основу сообщения в блоге и наиболее ценный контент.

(2) Если вас беспокоят конкретные вопросы, я ответил и рассмотрел наиболее распространенные вопросы и заблуждения в более поздней части сообщения в блоге.

(3) Если вы хотите получить глубокое представление о том, как работают графические процессоры и тензорные ядра, лучше всего прочитать сообщение в блоге от начала до конца. Вы можете пропустить один или два раздела в зависимости от вашего понимания представленных тем.

Я буду начинать каждый основной раздел с небольшим резюме, которое может помочь вам решить, хотите ли вы читать этот раздел или нет.

Обзор

Это сообщение в блоге структурировано следующим образом. Сначала я объясню, что делает графический процессор быстрым. Я расскажу о центральных процессорах и графических процессорах, тензорных ядрах, пропускной способности памяти и иерархии памяти графических процессоров, а также о том, как они связаны с производительностью глубокого обучения. Эти объяснения могут помочь вам получить более интуитивное представление о том, что искать в графическом процессоре. Затем я сделаю теоретические оценки производительности графического процессора и свяжу их с некоторыми маркетинговыми тестами NVIDIA, чтобы получить надежные и объективные данные о производительности.Я обсуждаю уникальные особенности новой серии графических процессоров NVIDIA RTX 30 Ampere, которые стоит учитывать при покупке графического процессора. Оттуда я даю рекомендации по графическим процессорам для 1-2, 4, 8 конфигураций графических процессоров и кластеров графических процессоров. После этого следует раздел вопросов и ответов, которые мне задают в ветках Twitter; В этом разделе я также рассмотрю распространенные заблуждения и некоторые разные проблемы, такие как облако против настольного компьютера, охлаждение, AMD против NVIDIA и другие.

Как работают графические процессоры?

Если вы часто используете графические процессоры, полезно понять, как они работают.Эти знания пригодятся для понимания того, почему графические процессоры в одних случаях могут быть медленными, а в других — быстрыми. В свою очередь, вы сможете лучше понять, зачем вам вообще нужен графический процессор и как другие будущие варианты оборудования могут конкурировать. Вы можете пропустить этот раздел, если вам просто нужны полезные цифры производительности и аргументы, которые помогут вам решить, какой графический процессор купить. Лучшее объяснение на высоком уровне вопроса о том, как работают графические процессоры, — это мой следующий ответ на Quora:

Прочтите ответ Тима Детмерса на вопрос, почему графические процессоры хорошо подходят для глубокого обучения? на Quora

Это объяснение высокого уровня, которое довольно хорошо объясняет, почему графические процессоры лучше, чем процессоры для глубокого обучения.Если мы посмотрим на детали, мы сможем понять, что делает один графический процессор лучше другого.

Наиболее важные характеристики графического процессора для скорости обработки глубокого обучения

Этот раздел поможет вам получить более интуитивное представление о том, как думать о производительности глубокого обучения. Это понимание поможет вам самостоятельно оценить будущие графические процессоры.

Тензорные ядра

Резюме:

  • Тензорные ядра сокращают количество используемых циклов, необходимых для вычисления операций умножения и сложения, в 16 раз — в моем примере для матрицы 32 × 32, со 128 до 8 циклов.
  • Тензорные ядра уменьшают зависимость от повторяющегося доступа к общей памяти, тем самым экономя дополнительные циклы доступа к памяти.
  • Тензорные ядра настолько быстры, что вычисления больше не являются узким местом. Единственное узкое место — это передача данных тензорным ядрам.

Сейчас достаточно дешевых графических процессоров, и почти каждый может позволить себе графический процессор с тензорными ядрами. Вот почему я рекомендую только графические процессоры с тензорными ядрами. Полезно понять, как они работают, чтобы оценить важность этих вычислительных единиц, специализирующихся на умножении матриц.Здесь я покажу вам простой пример умножения матриц A * B = C, где все матрицы имеют размер 32 × 32, как выглядит вычислительный шаблон с тензорными ядрами и без них. Это упрощенный пример, а не точный способ написания высокопроизводительного ядра матричного умножения, но в нем есть все основы. Программист CUDA воспримет это как первый «черновик», а затем оптимизирует его шаг за шагом с помощью таких понятий, как двойная буферизация, оптимизация регистров, оптимизация занятости, параллелизм на уровне инструкций и многие другие, которые я не буду обсуждать здесь. .9 циклов в секунду. Каждый цикл представляет собой возможность для вычислений. Однако в большинстве случаев операции занимают больше одного цикла. Таким образом, он создает конвейер, в котором для запуска одной операции ему необходимо дождаться количества циклов времени, которое требуется для завершения предыдущей операции. Это также называется задержкой операции.

Вот некоторые важные тайминги цикла или задержки для операций:

  • Доступ к глобальной памяти (до 48 ГБ): ~ 200 циклов
  • Доступ к общей памяти (до 164 КБ на потоковый мультипроцессор): ~ 20 циклов
  • Объединенное умножение и сложение (FFMA): 4 цикла
  • Умножение матрицы тензорного ядра: 1 цикл

Кроме того, вы должны знать, что наименьшие единицы потоков на графическом процессоре представляют собой пакет из 32 потоков — это называется искажением.Деформации обычно работают синхронно — потоки внутри основы должны ждать друг друга. Все операции с памятью на GPU оптимизированы для перекосов. Например, загрузка из глобальной памяти происходит с гранулярностью 32 * 4 байта, ровно 32 числа с плавающей запятой, ровно по одному числу с плавающей запятой для каждого потока в деформации. У нас может быть до 32 деформаций = 1024 потока в потоковом мультипроцессоре (SM), что является эквивалентом ядра ЦП на графическом процессоре. Ресурсы SM распределяются между всеми активными варпами. Это означает, что иногда мы хотим запускать меньше деформаций, чтобы иметь больше регистров / разделяемой памяти / ресурсов тензорного ядра на деформацию.

Для обоих следующих примеров мы предполагаем, что у нас одинаковые вычислительные ресурсы. Для этого небольшого примера умножения матрицы 32 × 32 мы используем 8 SM (около 10% от RTX 3090) и 8 деформаций на SM.

Умножение матриц без тензорных ядер

Если мы хотим выполнить матричное умножение A * B = C, где каждая матрица имеет размер 32 × 32, тогда мы хотим загрузить память, к которой мы постоянно обращаемся, в общую память, потому что ее задержка примерно в десять раз меньше (200 циклов против 20 циклов).Блок памяти в общей памяти часто называют плиткой памяти или просто плиткой. Загрузка двух поплавков 32 × 32 в плитку с общей памятью может происходить параллельно с использованием деформаций 2 * 32. У нас есть 8 SM с 8 деформациями в каждом, поэтому из-за распараллеливания нам нужно выполнить только одну последовательную загрузку из глобальной в разделяемую память, что занимает 200 циклов.

Чтобы выполнить матричное умножение, нам теперь нужно загрузить вектор из 32 чисел из общей памяти A и общей памяти B и выполнить объединенное умножение и накопление (FFMA).Затем сохраните выходные данные в регистрах C. Мы разделяем работу так, чтобы каждый SM выполнял 8-кратное скалярное произведение (32 × 32) для вычисления 8 выходных данных C. Почему это ровно 8 (4 в старых алгоритмах), это очень технический вопрос. Я рекомендую статью в блоге Скотта Грея об умножении матриц, чтобы понять это. Это означает, что у нас есть 8-кратный доступ к разделяемой памяти по цене 20 циклов каждая и 8 операций FFMA (32 параллельных), каждая из которых стоит 4 цикла. Таким образом, общая стоимость составляет:

200 циклов (глобальная память) + 8 * 20 циклов (общая память) + 8 * 4 цикла (FFMA) = 392 цикла

Давайте посмотрим на стоимость цикла использования тензорных ядер. .

Умножение матриц с тензорными ядрами

С тензорными ядрами мы можем выполнить умножение матриц 4 × 4 за один цикл. Для этого нам сначала нужно получить память в тензорном ядре. Как и в предыдущем случае, нам нужно читать из глобальной памяти (200 циклов) и сохранять в общей памяти. Чтобы выполнить матричное умножение 32 × 32, нам нужно выполнить 8 × 8 = 64 операций тензорных ядер. Один SM имеет 8 тензорных ядер. Итак, с 8 SM у нас есть 64 тензорных ядра — как раз то количество, которое нам нужно! Мы можем передать данные из общей памяти в тензорные ядра за 1 передачу памяти (20 циклов), а затем выполнить эти 64 параллельных операции тензорного ядра (1 цикл).Это означает, что общая стоимость умножения матриц тензорных ядер в данном случае составляет:

200 циклов (глобальная память) + 20 циклов (разделяемая память) + 1 цикл (тензорное ядро) = 221 цикл.

Таким образом, мы значительно снижаем стоимость умножения матриц с 392 до 221 цикла с помощью тензорных ядер. В этом упрощенном случае тензорные ядра снизили стоимость как доступа к общей памяти, так и операций FFMA.

Хотя этот пример примерно соответствует последовательности вычислительных шагов как с тензорными ядрами, так и без них, обратите внимание, что это очень упрощенный пример.Реальные случаи умножения матриц включают гораздо большие плитки общей памяти и несколько иные схемы вычислений.

Однако, как я полагаю, из этого примера также ясно, почему следующий атрибут, пропускная способность памяти, так важен для графических процессоров с Tensor-Core. Поскольку глобальная память составляет наиболее значительную часть стоимости цикла для матричного умножения с тензорными ядрами, у нас были бы даже более быстрые графические процессоры, если бы глобальная задержка памяти могла быть уменьшена. Мы можем сделать это либо путем увеличения тактовой частоты памяти (больше циклов в секунду, но также и большего количества тепла и более высоких требований к энергии), либо путем увеличения количества элементов, которые могут быть переданы в любой момент времени (ширина шины).

Пропускная способность памяти

Из предыдущего раздела мы видели, что тензорные ядра очень быстрые. Фактически, настолько быстры, что большую часть времени они простаивают, ожидая прибытия памяти из глобальной памяти. Например, во время обучения BERT Large, которое использует огромные матрицы — чем больше, тем лучше для тензорных ядер — у нас есть коэффициент использования TFLOPS тензорного ядра около 30%, что означает, что 70% времени тензорные ядра простаивают.

Это означает, что при сравнении двух графических процессоров с тензорными ядрами одним из лучших показателей производительности каждого графического процессора является их пропускная способность памяти.Например, у графического процессора A100 пропускная способность памяти 1555 ГБ / с против 900 ГБ / с у V100. Таким образом, базовая оценка ускорения A100 по сравнению с V100 составляет 1555/900 = 1,73x.

Общая память / Размер кэша L1 / Регистры

Поскольку передача памяти тензорным ядрам является ограничивающим фактором производительности, мы ищем другие атрибуты графического процессора, которые обеспечивают более быструю передачу памяти тензорным ядрам. Общая память, кэш L1 и количество используемых регистров взаимосвязаны. Чтобы понять, как иерархия памяти обеспечивает более быструю передачу памяти, это помогает понять, как умножение матриц выполняется на графическом процессоре.

Для выполнения матричного умножения мы используем иерархию памяти графического процессора, которая идет от медленной глобальной памяти к быстрой локальной общей памяти и к молниеносным регистрам. Однако чем быстрее память, тем она меньше. Таким образом, нам нужно разделить матрицу на более мелкие матрицы. Мы выполняем матричное умножение этих меньших плиток в локальной общей памяти, которая работает быстро и близко к потоковому мультипроцессору (SM) — эквиваленту ядра ЦП. С тензорными ядрами мы идем еще дальше: мы берем каждую плитку и загружаем часть этих плиток в тензорные ядра.Плитка матричной памяти в общей памяти примерно в 10-50 раз быстрее, чем глобальная память графического процессора, тогда как регистры тензорных ядер примерно в 200 раз быстрее, чем глобальная память графического процессора.

Наличие более крупных плиток означает, что мы можем повторно использовать больше памяти. Я подробно писал об этом в своем блоге TPU vs GPU. Фактически, вы можете видеть, что TPU имеет очень и очень большие плитки для каждого тензорного ядра. Таким образом, TPU могут повторно использовать гораздо больше памяти при каждой передаче из глобальной памяти, что делает их немного более эффективными при умножении матриц, чем графические процессоры.

Размер каждого тайла определяется объемом памяти, который у нас есть на один потоковый мультипроцессор (SM), что эквивалентно «ядру ЦП» на графическом процессоре. У нас есть следующие размеры разделяемой памяти на следующих архитектурах:

  • Volta: общая память 96 кбайт / 32 кбайт L1
  • Turing: 64 кбайт разделяемая память / 32 кбайт L1
  • ампер: 164 кбайт разделяемой памяти / 32 кбайт L1

Мы видим, что Ampere имеет гораздо большую разделяемую память, что позволяет использовать плитки большего размера, что снижает доступ к глобальной памяти.Таким образом, Ampere может лучше использовать общую пропускную способность памяти в памяти графического процессора. Это улучшает производительность примерно на 2-5%. Прирост производительности особенно заметен для огромных матриц.

Тензорные ядра Ampere имеют еще одно преимущество в том, что они совместно используют больше данных между потоками. Это уменьшает использование регистров. Регистры ограничены 64 КБ на потоковый мультипроцессор (SM) или 255 на поток. Сравнивая тензорное ядро ​​Volta и Ampere, тензорное ядро ​​Ampere использует в 3 раза меньше регистров, что позволяет большему количеству тензорных ядер быть активными для каждой плитки общей памяти.Другими словами, мы можем накормить в 3 раза больше тензорных ядер с тем же количеством регистров. Однако, поскольку пропускная способность по-прежнему является узким местом, вы увидите лишь незначительное увеличение фактического и теоретического TFLOPS. Новые тензорные ядра улучшают производительность примерно на 1-3%.

В целом, вы можете видеть, что архитектура Ampere оптимизирована, чтобы сделать доступную полосу пропускания памяти более эффективной за счет использования улучшенной иерархии памяти: от глобальной памяти до плиток общей памяти, чтобы зарегистрировать плитки для тензорных ядер.

Оценка производительности глубокого обучения Ampere

Резюме:

  • Теоретические оценки, основанные на пропускной способности памяти и улучшенной иерархии памяти графических процессоров Ampere, предсказывают ускорение от 1,78x до 1,87x.
  • NVIDIA предоставляет данные тестов точности для графических процессоров Tesla A100 и V100. Эти данные являются необъективными для маркетинговых целей, но на основе этих данных можно построить неэффективную модель.
  • Сведенные тестовые данные показывают, что Tesla A100 по сравнению с V100 составляет 1.В 70 раз быстрее для НЛП и в 1,45 раза быстрее для компьютерного зрения.

Этот раздел предназначен для тех, кто хочет разобраться в более технических деталях того, как я получаю оценки производительности для графических процессоров Ampere. Если вас не интересуют эти технические аспекты, можно пропустить этот раздел.

Оценки теоретической скорости в амперах

Объединив все рассуждения, приведенные выше, можно ожидать, что разница между двумя архитектурами графических процессоров, оснащенных тензорными ядрами, будет в основном связана с пропускной способностью памяти.Дополнительные преимущества заключаются в увеличении объема разделяемой памяти / кэша L1 и лучшего использования регистров в тензорных ядрах.

Если мы возьмем пропускную способность графического процессора Tesla A100 по сравнению с пропускной способностью Tesla V100, мы получим ускорение в 1555/900 = 1,73 раза. Кроме того, я ожидал бы ускорения на 2-5% от большей разделяемой памяти и на 1-3% от улучшенных тензорных ядер. Это дает диапазон ускорения от 1,78x до 1,87x. С помощью аналогичных рассуждений вы сможете оценить ускорение других графических процессоров серии Ampere по сравнению с Tesla V100.

Практические оценки ампер-скорости

Предположим, у нас есть оценка для одного графического процессора с архитектурой графического процессора, такой как Ampere, Turing или Volta. Эти результаты легко экстраполировать на другие графические процессоры той же архитектуры / серии. К счастью, NVIDIA уже протестировала A100 и V100 в широком диапазоне задач компьютерного зрения и понимания естественного языка. К сожалению, NVIDIA позаботилась о том, чтобы эти числа не были напрямую сопоставимы, используя разные размеры пакетов и количество графических процессоров, когда это возможно, в пользу результатов для A100.Так что в некотором смысле контрольные цифры частично честны, частично — маркетинговые. В общем, вы можете возразить, что использование пакетов большего размера справедливо, поскольку у A100 больше памяти. Тем не менее, чтобы сравнить архитектуры графических процессоров, мы должны оценить беспристрастную производительность памяти с тем же размером пакета.

Чтобы получить объективную оценку, мы можем масштабировать результаты V100 и A100 двумя способами: (1) учитывать различия в размере пакетов, (2) учитывать различия в использовании 1 и 8 графических процессоров. Нам повезло, что мы можем найти такую ​​оценку для обоих предубеждений в данных, которые предоставляет NVIDIA.

Удвоение размера пакета увеличивает пропускную способность с точки зрения изображений / с (CNN) на 13,6%. Я протестировал ту же проблему для трансформаторов на моем RTX Titan и обнаружил, что удивительно, тот же результат: 13,5% — похоже, это надежная оценка.

По мере того, как мы распараллеливаем сети между все большим и большим количеством графических процессоров, мы теряем производительность из-за некоторых сетевых накладных расходов. Система A100 8x GPU имеет лучшую сеть (NVLink 3.0), чем система V100 8x GPU (NVLink 2.0) — это еще один сбивающий с толку фактор.Глядя непосредственно на данные NVIDIA, мы можем обнаружить, что для CNN система с 8x A100 имеет накладные расходы на 5% меньше, чем система с 8x V100. Это означает, что если переход от 1x A100 к 8x A100 дает вам ускорение, скажем, в 7.00x, то переход с 1x V100 на 8x V100 дает ускорение только в 6,67x. По трансформаторам этот показатель составляет 7%.

Используя эти цифры, мы можем оценить ускорение для нескольких конкретных архитектур глубокого обучения на основе прямых данных, которые предоставляет NVIDIA. Tesla A100 предлагает следующее ускорение по сравнению с Tesla V100:

  • SE-ResNeXt101: 1.43x
  • Masked-R-CNN: 1,47x
  • Преобразователь (12 слоев, машинный перевод, WMT14 en-de): 1,70x

Таким образом, цифры немного ниже теоретической оценки для компьютерного зрения. Это может быть связано с меньшими тензорными размерами, накладными расходами на операции, необходимые для подготовки матричного умножения, такие как img2col или быстрое преобразование Фурье (БПФ), или операции, которые не могут насыщать графический процессор (конечные слои часто относительно малы). Это также могут быть артефакты конкретных архитектур (сгруппированная свертка).

Практическая оценка трансформатора очень близка к теоретической. Вероятно, это связано с тем, что алгоритмы для огромных матриц очень просты. Я буду использовать эти практические оценки для расчета рентабельности графических процессоров.

Возможные ошибки в оценках

Приведенные выше оценки относятся к A100 и V100. В прошлом NVIDIA скрывала необъявленное снижение производительности «игровых» графических процессоров RTX: (1) снижение использования тензорного ядра, (2) игровые вентиляторы для охлаждения, (3) отключение одноранговой передачи графических процессоров.Вполне возможно, что в серии RTX 30 наблюдается необъявленное снижение производительности по сравнению с полной версией Ampere A100.

На данный момент была обнаружена одна из этих деградаций: производительность тензорного ядра была снижена, поэтому графические процессоры серии RTX 30 не так хороши, как карты Quadro для целей глубокого обучения. Это также было сделано для серии RTX 20, поэтому в этом нет ничего нового, но на этот раз это также было сделано для эквивалентной карты Titan, RTX 3090. RTX Titan не включал снижение производительности.

Я буду обновлять эту запись в блоге по мере появления информации о дальнейшем необъявленном падении производительности.

Дополнительные соображения для серии Ampere / RTX 30

Резюме:

  • Ampere допускает редкое сетевое обучение, что ускоряет обучение в два раза.
  • Редкое сетевое обучение по-прежнему используется редко, но сделает Ampere перспективным.
  • Ampere имеет новые типы данных с низкой точностью, что значительно упрощает использование данных с низкой точностью, но не обязательно быстрее, чем для предыдущих графических процессоров.
  • Новый дизайн вентилятора превосходен, если у вас есть пространство между графическими процессорами, но неясно, будут ли эффективно охлаждаться несколько графических процессоров без промежутка между ними.
  • Трехслотовая конструкция RTX 3090 делает сборку с 4-кратным графическим процессором проблематичной. Возможные решения — варианты с двумя слотами или использование расширителей PCIe.
  • 4x RTX 3090 потребует больше энергии, чем любой стандартный блок питания на рынке может обеспечить прямо сейчас.

Новая серия NVIDIA Ampere RTX 30 обладает дополнительными преимуществами по сравнению с серией NVIDIA Turing RTX 20, такими как редкое сетевое обучение и логический вывод.Другие функции, такие как новые типы данных, следует рассматривать скорее как функцию простоты использования, поскольку они обеспечивают такой же прирост производительности, что и Тьюринг, но без какого-либо дополнительного программирования.

Обучение работе с разреженной сетью

Ampere обеспечивает автоматическое умножение разреженных матриц с мелкозернистой структурой на высокой скорости. Как это работает? Возьмите матрицу весов и разрежьте ее на части по 4 элемента. Теперь представьте, что 2 элемента из этих 4 равны нулю. На рисунке 1 показано, как это могло бы выглядеть.

Когда вы умножаете эту разреженную матрицу весов на несколько плотных входных данных, функция ядра тензора разреженной матрицы в Ampere автоматически сжимает разреженную матрицу до плотного представления, которое составляет половину размера, как показано на рисунке 2. После этого сжатия плотно сжатый матричный тайл подается в тензорное ядро, которое вычисляет матричное умножение, вдвое превышающее обычный размер. Это эффективно дает двукратное ускорение, поскольку требования к полосе пропускания при умножении матриц из общей памяти уменьшаются вдвое.

Рисунок 2: Разреженная матрица сжимается до плотного представления перед выполнением умножения матриц. Рисунок взят из презентации Джеффа Пула GTC 2020 об ускорении разреженности в архитектуре NVIDIA Ampere, любезно предоставленной NVIDIA.

В своем исследовании я работал над обучением разреженным сетям, а также написал в блоге сообщение о разреженном обучении. Одна из критических замечаний по поводу моей работы заключалась в том, что «вы уменьшаете количество FLOPS, необходимое для сети, но это не дает увеличения скорости, поскольку графические процессоры не могут выполнять быстрое умножение разреженных матриц.«Что ж, с добавлением функции умножения разреженных матриц для тензорных ядер, мой алгоритм или другие алгоритмы разреженного обучения теперь фактически обеспечивают ускорение до 2x во время обучения.

Рисунок 3. Алгоритм разреженного обучения, который я разработал, состоит из трех этапов: (1) Определение важности каждого уровня. (2) Уберите наименьшие, неважные веса. (3) Увеличивайте новые веса, пропорциональные важности каждого уровня. Узнайте больше о моей работе в моем небольшом сообщении в блоге о тренировках.

Хотя эта функция все еще является экспериментальной, а обучение разреженным сетям пока не является обычным явлением, наличие этой функции на вашем графическом процессоре означает, что вы готовы к будущему разреженного обучения.

Вычисление с низкой точностью

В своей работе я ранее показал, что новые типы данных могут улучшить стабильность при обратном распространении с низкой точностью.

Рисунок 4. Разработанные мной 8-битные типы данных глубокого обучения с низкой точностью. При обучении глубокому обучению используются узкоспециализированные типы данных. В моем типе данных динамического дерева используется динамический бит, который указывает начало двоичного дерева деления пополам, которое квантовало диапазон [0, 0,9], в то время как все предыдущие биты используются для экспоненты. Это позволяет с высокой точностью динамически представлять как большие, так и маленькие числа.

В настоящее время, если вы хотите иметь стабильное обратное распространение с 16-битными числами с плавающей запятой (FP16), большая проблема заключается в том, что обычные типы данных FP16 поддерживают только числа в диапазоне [-65,504, 65,504]. Если ваш градиент выходит за пределы этого диапазона, ваши градиенты превращаются в значения NaN. 38].BF16 имеет меньшую точность, то есть значащие цифры, но точность градиента не так важна для обучения. Итак, что делает BF16, так это то, что вам больше не нужно выполнять масштабирование потерь или беспокоиться о быстром увеличении градиента. Таким образом, мы должны увидеть повышение стабильности тренировки при использовании формата BF16 как небольшую потерю точности.

Что это означает для вас: с точностью BF16 тренировка может быть более стабильной, чем с точностью FP16, при том же ускорении. С точностью TF32 вы получаете стабильность, близкую к FP32, при этом ускорение приближается к FP16.Хорошо то, что для использования этих типов данных вы можете просто заменить FP32 на TF32 и FP16 на BF16 — никаких изменений кода не требуется!

В целом, однако, эти новые типы данных можно рассматривать как ленивые типы данных в том смысле, что вы могли бы получить все преимущества старых типов данных с некоторыми дополнительными усилиями программирования (правильное масштабирование потерь, инициализация, нормализация с использованием Apex) . Таким образом, эти типы данных не обеспечивают ускорения, а, скорее, упрощают использование низкой точности для обучения.

Новая конструкция вентилятора / проблемы с температурой

Новая конструкция вентилятора для серии RTX 30 включает в себя как нагнетательный, так и двухтактный вентилятор. Дизайн гениальный и будет очень эффективным, если у вас будет пространство между графическими процессорами. Так что, если у вас есть 2 графических процессора и один слот между ними (+3 слота PCIe), все будет в порядке, и проблем с охлаждением не будет. Однако неясно, как графические процессоры будут работать, если вы разместите их рядом друг с другом в установке с более чем двумя графическими процессорами. Вентилятор нагнетателя сможет выпускать воздух через кронштейн вдали от других графических процессоров, но невозможно сказать, насколько хорошо это работает, поскольку вентилятор имеет другую конструкцию, чем раньше.Итак, моя рекомендация: если вы хотите купить 1 графический процессор или 2 графических процессора в установке с 4 слотами PCIe, то проблем возникнуть не должно. Однако, если вы собираетесь использовать 3-4 графических процессора RTX 30 рядом друг с другом, я бы дождался отчетов о тепловой производительности, чтобы узнать, нужны ли вам другие кулеры графического процессора, расширители PCIe или другие решения. Я буду обновлять сообщение в блоге, добавляя эту информацию, когда она станет доступной.

В любом случае водяное охлаждение поможет решить проблемы с температурой. Многие производители предлагают блоки водяного охлаждения для карт RTX 3080 / RTX 3090, которые сохранят их охлаждение даже при установке 4x GPU.Остерегайтесь универсального решения водяного охлаждения для графических процессоров, если вы хотите запустить установку с 4-кратным графическим процессором, хотя в большинстве настольных ПК сложно разложить радиаторы.

Еще одно решение проблемы охлаждения — покупка расширителей PCIe и размещение графических процессоров внутри корпуса. Это очень эффективно, и мы с другими аспирантами Вашингтонского университета успешно используем эту установку. Это не выглядит красиво, но держит ваши графические процессоры крутыми! Это также может помочь, если у вас недостаточно места для размещения графических процессоров.Например, если вы можете найти место в корпусе настольного компьютера, можно купить стандартный RTX 3090 шириной 3 слота и распределить их с помощью удлинителей PCIe внутри корпуса. Благодаря этому вы можете решить как проблему с пространством, так и проблему охлаждения для установки 4x RTX 3090 с помощью одного простого решения.

Рисунок 5: 4 графических процессора с расширителями PCIe. Это похоже на беспорядок, но очень эффективно для охлаждения. Я использовал эту установку в течение 2 лет, и охлаждение отличное, несмотря на проблемные графические процессоры RTX 2080 Ti Founders Edition.

3-слотовый дизайн и проблемы с питанием

RTX 3090 — это 3-слотовый графический процессор, поэтому его нельзя будет использовать в 4-кратной конфигурации с вентилятором по умолчанию от NVIDIA. Это отчасти оправдано, потому что он работает с TDP 350 Вт, и его будет сложно охладить в настройке с несколькими графическими процессорами и двумя слотами. RTX 3080 лишь немного лучше при TDP 320 Вт, и охлаждение установки 4x RTX 3080 также будет очень сложным.

Также сложно запитать систему 4x 350 Вт = 1400 Вт в корпусе 4x RTX 3090. Блоки питания (БП) на 1600 Вт легко доступны, но всего 200 Вт для питания ЦП и материнской платы может быть слишком мало.Максимальная мощность компонентов используется только в том случае, если компоненты используются полностью, а при глубоком обучении ЦП обычно находится только при слабой нагрузке. При этом блок питания мощностью 1600 Вт может неплохо работать со сборкой 4x RTX 3080, но для сборки 4x RTX 3090 лучше искать блоки питания высокой мощности (+ 1700 Вт). Некоторые из моих последователей добились больших успехов в криптомайнинге блоков питания — более подробную информацию можно найти в разделе комментариев. В противном случае важно отметить, что не все розетки поддерживают блоки питания мощностью более 1600 Вт, особенно в США.По этой причине в США в настоящее время на рынке нет стандартного настольного блока питания мощностью более 1600 Вт. Если вы получаете сервер или блоки питания для крипто-майнинга, остерегайтесь форм-фактора — убедитесь, что он вписывается в корпус вашего компьютера.

Ограничение мощности: элегантное решение проблемы питания?

Для графических процессоров можно установить ограничение мощности. Таким образом, вы сможете программно установить предел мощности RTX 3090 до 300 Вт вместо стандартных 350 Вт. В системе с 4-кратным графическим процессором это экономия 200 Вт, чего может быть достаточно для создания системы с 4-кратным графическим процессором RTX 3090 с возможным блоком питания 1600 Вт.Это также помогает поддерживать охлаждение графических процессоров. Таким образом, установка ограничения мощности может решить две основные проблемы настройки 4x RTX 3080 или 4x RTX 3090, охлаждения и питания, одновременно. Для установки 4x вам по-прежнему нужны эффективные графические процессоры с нагнетателем (и стандартный дизайн может оказаться подходящим для этого), но это решает проблему с блоком питания.

Рис. 6. Снижение предела мощности имеет небольшой охлаждающий эффект. Снижение предела мощности RTX 2080 Ti на 50-60 Вт немного снижает температуру, и вентиляторы работают тише.

Вы можете спросить: «Разве это не замедляет работу графического процессора?» Да, но вопрос в том, насколько.Я протестировал систему 4x RTX 2080 Ti, показанную на рисунке 5, при различных ограничениях мощности, чтобы проверить это. Я измерил время для 500 мини-пакетов для BERT Large во время вывода (исключая слой softmax). Я выбираю BERT Large inference, поскольку, по моему опыту, это модель глубокого обучения, которая больше всего нагружает GPU. Таким образом, я ожидал, что ограничение мощности будет самым значительным замедлением для этой модели. Таким образом, указанные здесь замедления, вероятно, близки к максимальному замедлению, которого вы можете ожидать.Результаты показаны на рисунке 7.

Рисунок 7: Измеренное замедление для заданного предела мощности на RTX 2080 Ti. Измерения представляют собой среднее время обработки для 500 мини-партий BERT Large во время логического вывода (исключая слой softmax).

Как видим, установка лимита мощности не сильно влияет на производительность. Ограничение мощности на 50 Вт — более чем достаточно для обработки 4x RTX 3090 — снижает производительность всего на 7%.

Производительность глубокого обучения графического процессора

Следующий тест включает в себя не только тесты Tesla A100 и Tesla V100, но я построил модель, которая соответствует этим данным, и четыре различных теста на основе Titan V, Titan RTX, RTX 2080 Ti и RTX 2080 .[1,2,3,4] В обновлении я также учел недавно обнаруженное снижение производительности графических процессоров серии RTX 30. И с тех пор, как я написал этот пост в блоге, у нас появился первый надежный тест компьютерного зрения, подтверждающий мои цифры.

Помимо этого, я масштабировал промежуточные карты, такие как карты RTX 2070, RTX 2060 или Quadro RTX 6000 и 8000, путем интерполяции между этими точками контрольных данных. Обычно графические процессоры внутри архитектуры масштабируются довольно линейно в отношении потоковых мультипроцессоров и пропускной способности, и моя внутриархитектурная модель основана на этом.

Я собрал только эталонные данные для обучения FP16 смешанной точности, так как считаю, что нет веских причин, почему следует использовать обучение FP32.

Рисунок 8. Нормализованная производительность глубокого обучения графического процессора относительно RTX 2080 Ti.

По сравнению с RTX 2080 Ti, RTX 3090 обеспечивает ускорение в 1,41 раза для сверточных сетей и в 1,35 раза для трансформаторов, при этом цена выпуска выше на 15%. Таким образом, Ampere RTX 30 дает существенное улучшение по сравнению с серией Turing RTX 20 по необработанной производительности, а также является рентабельным (если вам не нужно обновлять блок питания и т. Д.).

Производительность глубокого обучения с помощью графического процессора на доллар

Какой графический процессор дает вам максимальную отдачу от вложенных средств? Это зависит от стоимости всей системы. Если у вас дорогая система, имеет смысл инвестировать в более дорогие графические процессоры.

Здесь у меня есть три сборки PCIe 3.0, которые я использую в качестве базовых затрат для систем с 2/4 GPU. Я беру эти базовые затраты и добавляю к ним затраты на графический процессор. Стоимость графического процессора — это среднее значение затрат на графический процессор на Amazon и eBay. Для новых графических процессоров Ampere я использую только отпускную цену.Вместе со значениями производительности, указанными выше, это дает значения производительности в расчете на доллар для этих систем графических процессоров. Для системы с 8 GPU я использую barebone-систему Supermicro — отраслевой стандарт для серверов RTX — в качестве базовой стоимости. Обратите внимание, что эти гистограммы не учитывают требования к памяти. Вы должны сначала подумать о своих требованиях к памяти, а затем искать лучший вариант в таблице. Вот несколько ориентировочных рекомендаций для памяти:

  • Использование предварительно обученных трансформаторов; обучение маленького трансформатора с нуля> = 11GB
  • Обучение большого трансформатора или сверточных сетей в исследованиях / производстве:> = 24 GB
  • Прототипирование нейронных сетей (трансформаторных или сверточных сетей)> = 10 GB
  • Соревнования Kaggle> = 8 GB
  • Применение компьютерного зрения> = 10 ГБ
  • Нейронные сети для видео: 24 ГБ
  • Обучение с подкреплением = 10 ГБ + мощный рабочий стол с глубоким обучением, самый большой процессор Threadripper или EPYC, который вы можете себе позволить.
Рисунок 9: Нормализованная производительность глубокого обучения на доллар относительно RTX 3080. Рисунок 10: Нормализованная производительность глубокого обучения на 4 ГП на доллар относительно RTX 3080 Рисунок 11. Нормализованная производительность глубокого обучения на 8 ГП на доллар доллар относительно RTX 3080

Рекомендации по графическому процессору

Первое, что нужно еще раз подчеркнуть: если вы выбираете графический процессор, вам необходимо убедиться, что в нем достаточно памяти для того, что вы хотите делать. Шаги по выбору лучшего графического процессора для глубокого обучения должны быть следующими:

  1. Что я хочу делать с графическим процессором: соревнования Kaggle, машинное обучение, обучение глубокому обучению, взлом небольших проектов (GAN-fun или big языковые модели?), проводите исследования в области компьютерного зрения / обработки естественного языка / в других областях или в чем-то еще?
  2. Сколько памяти мне нужно для того, что я хочу делать?
  3. Используйте приведенные выше графики стоимости / производительности, чтобы определить, какой графический процессор лучше всего подходит для вас, который соответствует критериям памяти.
  4. Есть ли дополнительные предостережения в отношении выбранного мной графического процессора? Например, если это RTX 3090, могу ли я установить его в свой компьютер? Достаточно ли мощности моего блока питания (БП) для поддержки моих графических процессоров? Будет ли проблема с отводом тепла, или можно как-то эффективно охладить графический процессор?

Некоторые из этих деталей требуют от вас размышлений о том, что вы хотите, и, возможно, небольшого исследования о том, сколько памяти имеют графические процессоры, которые другие люди используют для вашей области интересов. Я могу дать вам несколько советов, но я не могу здесь охватить все области.

Когда мне нужно> = 11 ГБ памяти?

Я уже упоминал, что у вас должно быть не менее 11 ГБ памяти, если вы работаете с трансформаторами, и, что еще лучше,> = 24 ГБ памяти, если вы исследуете трансформаторы. Это связано с тем, что большинство предыдущих предварительно обученных моделей имеют довольно высокие требования к памяти, и эти модели были обучены как минимум на графических процессорах RTX 2080 Ti с 11 ГБ памяти. Таким образом, размер менее 11 ГБ может создавать сценарии, в которых выполнение определенных моделей затруднено.

Другими областями, требующими большого объема памяти, являются любые медицинские изображения, некоторые современные модели компьютерного зрения, все, что связано с очень большими изображениями (GAN, передача стилей).

В общем, если вы стремитесь создавать модели, которые дадут вам преимущество в конкуренции, будь то исследования, промышленность или конкуренция Kaggle, дополнительная память предоставит вам возможное преимущество.

Когда меньше 11 ГБ памяти?

RTX 3070 и RTX 3080 — мощные карты, но им не хватает памяти.Однако для многих задач такой объем памяти не требуется.

RTX 3070 идеально подходит, если вы хотите изучить глубокое обучение. Это потому, что базовым навыкам обучения большинству архитектур можно научиться, просто немного уменьшив их масштаб или используя немного меньшие входные изображения. Если бы я снова изучил глубокое обучение, я бы, вероятно, использовал один RTX 3070 или даже несколько, если бы у меня были свободные деньги.

RTX 3080 в настоящее время является самой экономичной картой и поэтому идеально подходит для создания прототипов.Для прототипирования вам нужна самая большая память, которая по-прежнему стоит дешево. Под прототипированием я имею в виду прототипирование в любой области: исследования, конкурентный Kaggle, взлом идей / моделей для стартапа, эксперименты с исследовательским кодом. Для всех этих приложений RTX 3080 — лучший графический процессор.

Предположим, я возглавлю исследовательскую лабораторию / стартап. Я бы вложил 66-80% своего бюджета в машины RTX 3080 и 20-33% на «развернутые» машины RTX 3090 с надежной системой водяного охлаждения. Идея заключается в том, что RTX 3080 намного более экономичен и может использоваться совместно с помощью кластера slurm в качестве машин для создания прототипов.Поскольку прототипирование должно выполняться гибко, оно должно выполняться с меньшими моделями и меньшими наборами данных. RTX 3080 идеально подходит для этого. Как только студенты / коллеги получат отличный прототип модели, они могут развернуть прототип на машинах RTX 3090 и масштабировать его до более крупных моделей.

Как мне поместить модели +24 ГБ в память 10 ГБ?

Это немного противоречиво, потому что я только что сказал, что если вы хотите обучать большие модели, вам нужно много памяти, но мы много боролись с большими моделями с момента натиска BERT, и существуют решения для обучения моделей 24 ГБ за 10 ГБ памяти.Если у вас нет денег или чего-либо, чтобы избежать проблем с охлаждением / питанием RTX 3090, вы можете получить RTX 3080 и просто согласиться с тем, что вам нужно выполнить дополнительное программирование, добавив методы экономии памяти. Для этого достаточно техник, и они становятся все более и более обычными.

Вот лишь список общих техник:

  • Обучение FP16 / BF16 (вершина)
  • Контрольная точка градиента (сохраняет только некоторые активации и пересчитывает их при обратном проходе)
  • Обмен памяти между графическими процессорами и процессорами (подкачка уровни, не требующиеся для ЦП; поменяйте их вовремя для обратного распространения)
  • Параллелизм моделей (каждый графический процессор содержит часть каждого уровня; поддерживается fairseq)
  • Конвейерный параллелизм (каждый графический процессор содержит пару уровней сеть)
  • Параллелизм ZeRO (каждый графический процессор содержит частичные слои)
  • Трехмерный параллелизм (Модель + конвейер + ZeRO)
  • Состояние оптимизатора ЦП (сохранение и обновление Adam / Momentum на ЦП во время следующего прямого прохода графического процессора)

Если вы не боитесь немного повозиться и реализовать некоторые из этих методов — что обычно означает интеграцию поддерживающих их пакетов с вашим кодом — вы сможете разместить эту большую сеть на 24 ГБ на меньшем графическом процессоре.С таким хакерским духом RTX 3080 или любой графический процессор с объемом памяти менее 11 ГБ может стать для вас отличным графическим процессором.

Стоит ли обновление графического процессора RTX 20 до RTX 30? Или мне ждать следующего GPU?

На вашем месте я бы дважды подумал о переходе с графического процессора RTX 20 на графический процессор RTX 30. Возможно, вы захотите получить на 30% более быстрое обучение или около того, но решить все другие проблемы с графическим процессором RTX 30 может оказаться большой головной болью. Блок питания, охлаждение, вам нужно продать старые графические процессоры.Оно того стоит?

Я могу себе представить, нужна ли вам эта дополнительная память, например, для перехода с RTX 2080 Ti на RTX 3090, или если вам нужен огромный прирост производительности, скажем, с RTX 2060 на RTX 3080, тогда это того стоит. . Но если вы останетесь «в своей лиге», то есть переходите с Titan RTX на RTX 3090 или с RTX 2080 Ti на RTX 3080, это вряд ли того стоит. Вы получаете немного производительности, но у вас будут проблемы с блоком питания и охлаждением, и вы будете легче на приличную сумму денег.Не думаю, что оно того стоит. Я бы дождался выхода лучшей альтернативы памяти GDDR6X. Это заставит графические процессоры потреблять меньше энергии и даже может сделать их быстрее. Может быть, подождать год и посмотреть, как с тех пор изменился ландшафт.

Стоит отметить, что технологии в любом случае замедляются. Таким образом, ожидание в течение года может дать вам графический процессор, который будет оставаться актуальным более 5 лет. Придет время, когда можно будет производить дешевую память HBM. Если это время придет, и вы купите этот графический процессор, и вы, вероятно, останетесь на нем более 7 лет.Такие графические процессоры могут появиться через 3-4 года. Таким образом, игра в ожидание может быть довольно разумным выбором.

Общие рекомендации

В целом серия RTX 30 очень мощная, и я рекомендую эти графические процессоры. Помните о памяти, как обсуждалось в предыдущем разделе, а также о требованиях к питанию и охлаждению. Если у вас есть один слот PCIe между графическими процессорами, с охлаждением проблем не возникнет. В противном случае, с картами RTX 30, убедитесь, что у вас есть водяное охлаждение, удлинители PCIe или эффективные карты с вентилятором (данные в ближайшие недели покажут, что конструкция вентилятора NVIDIA соответствует требованиям).

В целом, я бы порекомендовал RTX 3090 всем, кто может себе это позволить. Он будет служить вам не только сейчас, но и будет очень эффективной картой в ближайшие 3-7 лет. Таким образом, это хорошее вложение, которое останется сильным. Маловероятно, что память HBM станет дешевой в течение трех лет, поэтому следующий графический процессор будет примерно на 25% лучше, чем RTX 3090. Мы, вероятно, увидим дешевую память HBM через 3-5 лет, так что после этого вы определенно захотите Обновить.

Для аспирантов, тех, кто хочет стать аспирантом, или тех, кто начинает работу в докторантуре, я рекомендую графические процессоры RTX 3080 для создания прототипов и графические процессоры RTX 3090 для развертывания.Если в вашем отделе есть кластер GPU, я настоятельно рекомендую кластер Slurm GPU с 8 машинами GPU. Однако, поскольку охлаждение графических процессоров RTX 3080 в конфигурации сервера с 8-кратным графическим процессором вызывает сомнения, маловероятно, что вы сможете их запустить. Если охлаждение работает, я бы порекомендовал 66-80% графических процессоров RTX 3080, а остальные графические процессоры были либо RTX 3090, либо Tesla A100. Если охлаждение не работает, я бы рекомендовал 66-80% RTX 2080, а остальное — Tesla A100. Опять же, очень важно, чтобы вы позаботились о проблемах с нагревом на ваших серверах с графическим процессором, прежде чем переходить к конкретным графическим процессорам для своих серверов.Подробнее о кластерах GPU ниже.

Если у вас несколько RTX 3090, убедитесь, что вы выбрали решения, которые гарантируют достаточное охлаждение и питание. Я буду обновлять сообщение в блоге об этом, поскольку все больше и больше данных накапливаются в том, что является правильной настройкой.

Для тех, у кого нет строго конкурентных требований (исследования, соревновательный Kaggle, конкурентоспособные стартапы), я бы порекомендовал по порядку: использованный RTX 2080 Ti, использованный RTX 2070, новый RTX 3080, новый RTX 3070. Если вам не нравятся использованные карты, но RTX 3080.Если вы не можете позволить себе RTX 3080, выбирайте RTX 3070. Все эти карты являются очень экономичными решениями и обеспечат быстрое обучение большинства сетей. Если вы используете правильные трюки с памятью и хорошо разбираетесь в дополнительном программировании, теперь есть достаточно уловок, чтобы сделать нейронную сеть на 24 Гбайт встроенной в графический процессор 10 Гбайт. Таким образом, если вы принимаете некоторую неопределенность и дополнительное программирование, RTX 3080 также может быть лучшим выбором по сравнению с RTX 3090, поскольку производительность у этих карт примерно одинакова.

Если ваш бюджет ограничен, а RTX 3070 слишком дорога, подержанная RTX 2070 стоит около 260 долларов на eBay. Пока не ясно, будет ли RTX 3060, но если у вас ограниченный бюджет, возможно, стоит подождать еще немного. Если цена аналогична RTX 2060 и GTX 1060, вы можете рассчитывать на цену от 250 до 300 долларов и довольно высокую производительность.

Если ваш бюджет ограничен, но вам все еще нужен большой объем памяти, то старые бывшие в употреблении карты Tesla или Quadro с eBay могут быть лучшими для вас.Quadro M6000 имеет 24 ГБ памяти и продается на eBay за 400 долларов. Tesla K80 имеет графический процессор 2-в-1 с 2x 12 ГБ памяти примерно за 200 долларов. Эти карты медленные по сравнению с более современными картами, но дополнительная память может пригодиться для конкретных проектов, где память имеет первостепенное значение.

Рекомендации для кластеров графических процессоров

Конструкция кластеров графических процессоров сильно зависит от использования. Для системы на +1 024 GPU сетевое взаимодействие имеет первостепенное значение, но если пользователи используют не более 32 GPU одновременно в такой системе, инвестирование в мощную сетевую инфраструктуру будет напрасной тратой.Здесь я бы пошел с аналогичными рассуждениями о прототипировании и развертывании, как упоминалось в случае RTX 3080 vs RTX 3090.

Как правило, использование карт RTX в центрах обработки данных запрещено лицензионным соглашением CUDA. Однако часто университеты могут получить освобождение от этого правила. По этому поводу стоит связаться с кем-нибудь из NVIDIA, чтобы попросить освобождение. Если вам разрешено использовать карты RTX, я бы порекомендовал стандартные системы графических процессоров Supermicro 8 с графическими процессорами RTX 3080 или RTX 3090 (если можно обеспечить достаточное охлаждение).Небольшой набор из 8 узлов A100 обеспечивает эффективное «развертывание» после прототипирования, особенно если нет гарантии, что серверы 8x RTX 3090 могут быть достаточно охлаждены. В этом случае я бы порекомендовал A100 вместо RTX 6000 / RTX 8000, потому что A100 довольно экономичен и рассчитан на будущее.

Если вы хотите обучить обширные сети на кластере графических процессоров (+256 графических процессоров), я бы порекомендовал систему NVIDIA DGX SuperPOD с графическими процессорами A100. При масштабе GPU +256 сетевое взаимодействие становится первостепенным. Если вы хотите масштабироваться до более чем 256 графических процессоров, вам нужна высокооптимизированная система, и объединение стандартных решений больше не помогает.

Особенно в масштабе +1024 графических процессоров единственными конкурентоспособными решениями на рынке являются Google TPU Pod и NVIDIA DGX SuperPod. В таком масштабе я бы предпочел Google TPU Pod, поскольку их настраиваемая сетевая инфраструктура, кажется, превосходит систему NVIDIA DGX SuperPod, хотя обе системы довольно близки друг к другу. Система графического процессора предлагает немного большую гибкость моделей и приложений глубокого обучения по сравнению с системой TPU, в то время как система TPU поддерживает более крупные модели и обеспечивает лучшее масштабирование.Таким образом, обе системы имеют свои преимущества и недостатки.

Не покупайте эти графические процессоры

Я не рекомендую покупать несколько версий RTX Founders Edition (любых) или RTX Titans, если у вас нет расширителей PCIe для решения их проблем с охлаждением. Они просто будут слишком горячими, и их производительность будет намного ниже, чем я сообщаю на диаграммах выше. Графические процессоры 4x RTX 2080 Ti Founders Editions легко превысят 90 ° C, снизят частоту ядра и будут работать медленнее, чем должным образом охлаждаемые графические процессоры RTX 2070.

Я не рекомендую покупать Tesla V100 или A100, если только вы не вынуждены их покупать (политика запрещенных центров обработки данных RTX для компаний) или если вы не хотите обучать очень большие сети на огромном кластере графических процессоров — эти графические процессоры просто не очень дороги — эффективный.

Если вы можете позволить себе карты получше, не покупайте карты серии GTX 16. Эти карты не имеют тензорных ядер и, как таковые, обеспечивают относительно низкую производительность глубокого обучения. Я бы предпочел использовать RTX 2070 / RTX 2060 / RTX 2060 Super вместо карты серии GTX 16.Однако, если у вас мало денег, карты серии GTX 16 могут быть хорошим вариантом.

Когда лучше не покупать новые графические процессоры?

Если у вас уже есть графические процессоры RTX 2080 Tis или лучше, обновление до RTX 3090 может не иметь смысла. Ваши графические процессоры уже довольно хороши, а прирост производительности незначителен по сравнению с беспокойством о блоке питания и проблемах с охлаждением для новых энергоемких карт RTX 30 — просто того не стоит.

Единственная причина, по которой я хотел бы перейти с 4x RTX 2080 Ti на 4x RTX 3090, — это если я буду исследовать огромные трансформаторы или другое сетевое обучение, зависящее от вычислений.Однако, если проблема с памятью, вы можете сначала подумать о некоторых хитростях с памятью, чтобы уместить большие модели на 4x RTX 2080 Tis, прежде чем переходить на RTX 3090s.

Если у вас один или несколько графических процессоров RTX 2070, я бы дважды подумал об обновлении. Это довольно хорошие графические процессоры. Однако перепродажа этих графических процессоров на eBay и получение RTX 3090 может иметь смысл, если вы часто обнаруживаете, что ограничены 8 ГБ памяти. Это рассуждение справедливо и для многих других графических процессоров: если памяти мало, обновление будет правильным.

Вопросы и ответы и заблуждения

Резюме:

  • PCIe 4.0 и PCIe не имеют значения в конфигурациях 2x GPU. Для конфигураций с 4-кратным графическим процессором они по-прежнему не имеют большого значения.
  • RTX 3090 и RTX 3080 с охлаждением будет проблематично. Используйте карты с водяным охлаждением или удлинители PCIe.
  • NVLink бесполезен. Полезно только для кластеров GPU.
  • Вы можете использовать различные типы графических процессоров на одном компьютере (например, GTX 1080 + RTX 2080 + RTX 3090), но вы не сможете эффективно распараллеливать их.
  • Вам понадобится сеть Infiniband + 50 Гбит / с, чтобы распараллелить обучение на более чем двух машинах.
  • процессоры AMD дешевле процессоров Intel; У процессоров Intel почти нет преимущества.
  • Несмотря на героические усилия по разработке программного обеспечения, AMD GPU + ROCm, вероятно, не сможет конкурировать с NVIDIA из-за отсутствия сообщества и эквивалента Tensor Core в течение как минимум 1-2 лет.
  • Облачные графические процессоры полезны, если вы используете их менее 1 года. После этого десктоп — более дешевое решение.

Нужен ли мне PCIe 4.0?

Как правило, нет. PCIe 4.0 отлично подходит, если у вас есть кластер графического процессора.Это нормально, если у вас есть машина с 8-кратным графическим процессором, но в остальном это не дает много преимуществ. Это обеспечивает лучшее распараллеливание и немного более быструю передачу данных. Передача данных не является узким местом ни в одном приложении. В компьютерном зрении в конвейере передачи данных узким местом может быть хранилище данных, но не передача PCIe от центрального процессора к графическому процессору. Так что для большинства людей нет реальной причины устанавливать PCIe 4.0. Выгоды будут, возможно, на 1-7% лучше распараллеливания при установке с 4 GPU.

Нужны ли мне линии PCIe 8x / 16x?

То же, что и для PCIe 4.0 — вообще нет. Дорожки PCIe необходимы для распараллеливания и быстрой передачи данных, что редко бывает узким местом. Работа графических процессоров на 4х полосах — это нормально, особенно если у вас всего 2 графических процессора. Для настройки с 4 графическими процессорами я бы предпочел 8 полос на каждый графический процессор, но запуск их на 4 полосы, вероятно, снизит производительность только примерно на 5-10%, если вы распараллеливаете все 4 графических процессора.

Как мне установить 4x RTX 3090, если они занимают по 3 слота PCIe каждый?

Вам нужен один из двухслотовых вариантов, или вы можете попробовать разложить их с помощью расширителей PCIe.Кроме места, сразу стоит подумать об охлаждении и подходящем БП. Кажется, наиболее управляемым решением будет установка 4x RTX 3090 EVGA Hydro Copper с индивидуальным контуром водяного охлаждения. Это сохранит карты очень крутыми. EVGA в течение многих лет производила версии графических процессоров с гидро-медью, и я считаю, что вы можете доверять качеству их графических процессоров с водяным охлаждением. Хотя могут быть и другие варианты, которые дешевле.

Удлинители PCIe также могут решить проблемы с пространством и охлаждением, но вам нужно убедиться, что в вашем корпусе достаточно места для размещения графических процессоров.Убедитесь, что ваши удлинители PCIe достаточно длинные!

Как мне охладить 4x RTX 3090 или 4x RTX 3080?

См. Предыдущий раздел.

Могу ли я использовать несколько графических процессоров с разными типами графических процессоров?

Да, можно! Но вы не можете эффективно распараллеливать графические процессоры разных типов. Я мог представить себе, что 3x RTX 3070 + 1 RTX 3090 могут иметь смысл для разделения прототипирования и развертывания. С другой стороны, распараллеливание между 4-мя графическими процессорами RTX 3070 было бы очень быстрым, если бы вы могли приспособить модель к этим графическим процессорам.Я могу придумать еще одну причину, по которой вы хотите это сделать, — это то, собираетесь ли вы использовать свои старые графические процессоры. Это работает нормально, но распараллеливание между этими графическими процессорами будет неэффективным, поскольку самый быстрый графический процессор будет ждать, пока самый медленный графический процессор не догонит точку синхронизации (обычно обновление градиента).

Что такое NVLink и насколько он полезен?

Обычно NVLink бесполезен. NVLink — это высокоскоростное соединение между графическими процессорами. Это полезно, если у вас есть кластер GPU с +128 GPU.В противном случае он почти не дает преимуществ по сравнению со стандартными передачами PCIe.

Мне не хватает денег даже на самые дешевые графические процессоры, которые вы рекомендуете. Что я могу сделать?

Обязательно купите бывшие в употреблении графические процессоры. Подержанные RTX 2070 (400 долларов) и RTX 2060 (300 долларов) великолепны. Если вы не можете себе этого позволить, следующий лучший вариант — попытаться получить подержанный GTX 1070 (220 долларов США) или GTX 1070 Ti (230 долларов США). Если это слишком дорого, подержанный GTX 980 Ti (6 ГБ, 150 долларов) или подержанный GTX 1650 Super (190 долларов). Если это слишком дорого, лучше всего использовать бесплатные облачные сервисы GPU.Обычно они предоставляли графический процессор на ограниченное количество времени / кредитов, после чего вам нужно будет заплатить. Переключайтесь между сервисами и учетными записями, пока не сможете позволить себе собственный графический процессор.

Каков углеродный след графических процессоров? Как я могу использовать графические процессоры, не загрязняя окружающую среду?

Я создал калькулятор углерода для расчета вашего углеродного следа для ученых (углерод от перелетов до конференций + время на GPU). Калькулятор также можно использовать для расчета чистого углеродного следа графического процессора. Вы обнаружите, что графические процессоры производят гораздо больше углерода, чем международные рейсы.Таким образом, вы должны убедиться, что у вас есть зеленый источник энергии, если вы не хотите иметь астрономический углеродный след. Если в нашем районе нет поставщиков электроэнергии, обеспечивающих экологически чистую энергию, лучший способ — это покупка компенсации за выбросы углерода. Многие люди скептически относятся к компенсации выбросов углерода. Они работают? Это жульничество?

Я считаю, что в данном случае скептицизм просто ранит, потому что бездействие будет более вредным, чем риск быть обманутым. Если вы беспокоитесь о мошенничестве, просто инвестируйте в портфель компенсаций, чтобы минимизировать риск.

Я работал над проектом по компенсации выбросов углерода около десяти лет назад. Компенсация углерода была произведена за счет сжигания метана, вытекающего из шахт в Китае. Должностные лица ООН отслеживали этот процесс и потребовали чистых цифровых данных и физического осмотра объекта. В этом случае произведенные компенсации углерода были очень надежными. Я считаю, что многие другие проекты имеют аналогичные стандарты качества.

Что мне нужно для распараллеливания на двух машинах?

Если вы хотите быть в безопасности, вы должны получить сетевые карты со скоростью не менее + 50 Гбит / с, чтобы получить ускорение, если вы хотите распараллеливать машины.Я рекомендую установить как минимум EDR Infiniband, то есть сетевую карту с пропускной способностью не менее 50 ГБит / с. Две карты EDR с кабелем стоят около 500 долларов на eBay.

В некоторых случаях вы можете обойтись без Ethernet 10 Гбит / с, но обычно это справедливо только для специальных сетей (определенных сверточных сетей) или если вы используете определенные алгоритмы (Microsoft DeepSpeed).

Подходит ли функция умножения разреженных матриц для разреженных матриц в целом?

Не похоже.Поскольку степень детализации разреженной матрицы должна иметь 2 элемента с нулевым значением, каждые 4 элемента, разреженные матрицы должны быть достаточно структурированными. Возможно, можно немного изменить алгоритм, что предполагает объединение 4 значений в сжатое представление 2 значений, но это также означает, что точное произвольное умножение разреженных матриц невозможно с графическими процессорами Ampere.

Нужен ли мне процессор Intel для работы с несколькими графическими процессорами?

Я не рекомендую процессоры Intel, если вы не используете их в соревнованиях Kaggle (тяжелая линейная алгебра на процессоре).Но даже для соревнований Kaggle процессоры AMD по-прежнему хороши. Процессоры AMD дешевле и лучше, чем процессоры Intel в целом для глубокого обучения. Для построенного 4-кратного графического процессора моим центральным процессором был бы Threadripper. Мы создали десятки систем в нашем университете с помощью Threadrippers, и все они отлично работают — пока нет жалоб. Для систем с 8-кратным графическим процессором я обычно выбираю процессоры, с которыми у вашего поставщика есть опыт. Надежность ЦП и PCIe / системы более важна в системах 8x, чем прямая производительность или прямая рентабельность.

Имеет ли значение дизайн корпуса компьютера для охлаждения?

Нет. Графические процессоры обычно отлично охлаждаются, если между графическими процессорами есть хотя бы небольшой зазор. Дизайн корпуса даст вам температуру на 1-3 градуса выше, а пространство между графическими процессорами — на 10-30 градусов тепла. Суть в том, что если у вас есть пространство между графическими процессорами, охлаждение не имеет значения. Если у вас нет места между графическими процессорами, вам нужна подходящая конструкция кулера (нагнетательный вентилятор) или другое решение (водяное охлаждение, удлинители PCIe), но в любом случае конструкция корпуса и вентиляторы не имеют значения.

Смогут ли графические процессоры AMD + ROCm когда-либо догнать графические процессоры NVIDIA + CUDA?

Не в ближайшие 1-2 года. Это трехсторонняя проблема: тензорные ядра, программное обеспечение и сообщество.

Графические процессоры AMD великолепны с точки зрения чистого кремния: отличная производительность FP16, отличная пропускная способность памяти. Однако из-за отсутствия тензорных ядер или эквивалентных им производительность глубокого обучения ниже, чем у графических процессоров NVIDIA. Упакованная математика низкой точности не справляется. Без этой аппаратной функции графические процессоры AMD никогда не будут конкурентоспособными.По слухам, в 2020 году планируется выпустить некую карту центра обработки данных с эквивалентом Tensor Core, но с тех пор новых данных не появилось. Наличие карт для центров обработки данных с эквивалентом Tensor Core также означает, что немногие смогут позволить себе такие графические процессоры AMD, что даст NVIDIA конкурентное преимущество.

Допустим, AMD представит аппаратную функцию, подобную тензорному ядру, в будущем. Тогда многие люди скажут: «Но нет программного обеспечения, которое работает с графическими процессорами AMD! Как я должен их использовать? » Это в основном заблуждение.Программное обеспечение AMD через ROCm прошло долгий путь, а поддержка через PyTorch превосходна. Хотя я не видел много отчетов об опыте использования графических процессоров AMD + PyTorch, все функции программного обеспечения интегрированы. Кажется, если вы выберете любую сеть, у вас все будет хорошо, если вы запустите ее на графических процессорах AMD. Так что здесь AMD прошла долгий путь, и этот вопрос более-менее решен.

Однако, если решить проблему программного обеспечения и отсутствия тензорных ядер, у AMD все равно останется проблема: отсутствие сообщества. Если у вас возникла проблема с графическими процессорами NVIDIA, вы можете найти ее в Google и найти решение.Это вызывает большое доверие к графическим процессорам NVIDIA. У вас есть инфраструктура, которая упрощает использование графических процессоров NVIDIA (работает любая среда глубокого обучения, любая научная проблема хорошо поддерживается). У вас есть хитрости и уловки, которые упрощают использование графических процессоров NVIDIA (например, Apex). Вы можете найти экспертов по графическим процессорам NVIDIA и программированию повсюду, в то время как я знал гораздо меньше экспертов по графическим процессорам AMD.

С точки зрения сообщества AMD чем-то похожа на Джулию против Python. У Джулии большой потенциал, и многие справедливо сказали бы, что это лучший язык программирования для научных вычислений.Тем не менее, Julia почти не используется по сравнению с Python. Это потому, что сообщество Python очень сильное. Numpy, SciPy, Pandas — это мощные программные пакеты, вокруг которых собирается большое количество людей. Это очень похоже на проблему NVIDIA vs AMD.

Таким образом, вполне вероятно, что AMD не догонит, пока не будет представлен эквивалент Tensor Core (от 1/2 до 1 года?) И сильное сообщество не будет построено вокруг ROCm (2 года?). AMD всегда будет отнимать часть доли рынка в определенных подгруппах (например,, майнинг криптовалюты, дата-центры). Тем не менее, в области глубокого обучения NVIDIA, вероятно, сохранит свою монополию как минимум еще на пару лет.

Когда лучше использовать облако по сравнению с выделенным рабочим столом / сервером с графическим процессором?

Практическое правило: если вы планируете проводить глубокое обучение дольше года, дешевле приобрести графический процессор для настольных ПК. В противном случае облачные экземпляры предпочтительнее, если у вас нет обширных навыков облачных вычислений и вы не хотите пользоваться преимуществами увеличения и уменьшения количества графических процессоров по желанию.

Точный момент времени, когда облачный графический процессор стоит дороже, чем настольный компьютер, в значительной степени зависит от службы, которую вы используете, и лучше всего самостоятельно посчитать это. Ниже я делаю пример расчета для спотового экземпляра AWS V100 с 1x V100 и сравниваю его со стоимостью настольного компьютера с одним RTX 3090 (аналогичная производительность). Настольный компьютер с RTX 3090 стоит 2200 долларов (2-GPU barebone + RTX 3090). Кроме того, если вы находитесь в США, за электроэнергию взимается дополнительная плата в размере 0,12 доллара США за кВтч.Для сравнения, для инстанса AWS по требованию этот показатель составляет 2,14 доллара в час.

При 15% загрузке в год настольный компьютер использует:

(350 Вт (GPU) + 100 Вт (CPU)) * 0,15 (загрузка) * 24 часа * 365 дней = 591 кВтч в год

Итак, 591 кВтч из электричество в год, то есть дополнительно 71 доллар.

Точка безубыточности для настольного компьютера по сравнению с облачным экземпляром при использовании 15% (вы используете облачный экземпляр 15% времени в течение дня) составит около 300 дней (2311 долларов против 2270 долларов):

2 доллара.14 / час * 0,15 (использование) * 24 часа * 300 дней = 2311 долларов США

Поэтому, если вы планируете запускать модели глубокого обучения через 300 дней, лучше купить настольный компьютер вместо использования инстансов AWS по требованию.

спотовые инстансы AWS немного дешевле — около 0,9 доллара в час. Однако многие пользователи Твиттера говорили мне, что инстансы по требованию — это кошмар, а точечные инстансы — это ада . Сам AWS указывает, что средняя частота прерываний спотовых инстансов V100 GPU превышает 20%.Это означает, что вам нужна довольно хорошая инфраструктура управления спотовыми инстансами, чтобы оправдать использование спотовых инстансов. Но если он у вас есть, то спотовые инстансы AWS и аналогичные сервисы довольно конкурентоспособны. Вам необходимо владеть настольным компьютером и запускать его в течение 20 месяцев, чтобы он работал даже по сравнению со спотовыми инстансами AWS. Это означает, что если вы планируете запускать рабочие нагрузки глубокого обучения в ближайшие 20 месяцев, настольный компьютер будет дешевле (и проще в использовании).

Вы можете выполнить аналогичные вычисления для любой облачной службы, чтобы принять решение, выберете ли вы облачную службу или настольный компьютер.

Общие показатели использования следующие:

  • Персональный рабочий стол аспиранта: <15%
  • Кластер slurm аспиранта GPU:> 35%
  • Кластер исследования slurm в масштабах компании:> 60%

В целом использование ставки ниже для профессий, в которых размышление о передовых идеях важнее, чем разработка практических продуктов. В некоторых областях коэффициент использования низкий (исследования интерпретируемости), в то время как в других областях коэффициент использования намного выше (машинный перевод, языковое моделирование).В целом использование персональных машин почти всегда переоценивается. Обычно коэффициент использования большинства персональных систем составляет 5-10%. Вот почему я настоятельно рекомендую кластеры slurm GPU для исследовательских групп и компаний вместо отдельных настольных компьютеров с GPU.

TL; DR advice

Лучший графический процессор в целом : RTX 3080 и RTX 3090.

Графические процессоры, которых следует избегать (в отдельности) : любая карта Tesla; любая карта Quadro; любая карта Founders Edition; Titan RTX, Titan V, Titan XP.

Рентабельно, но дорого : RTX 3080.

Рентабельно и дешевле : RTX 3070, RTX 2060 Super

У меня мало денег : Купите старые карты. Иерархия: RTX 2070 (400 долларов), RTX 2060 (300 долларов), GTX 1070 (220 долларов), GTX 1070 Ti (230 долларов), GTX 1650 Super (190 долларов), GTX 980 Ti (6 ГБ, 150 долларов).

У меня почти нет денег : Есть много стартапов, которые продвигают свои облака: используйте бесплатные облачные кредиты и меняйте учетные записи компаний, пока вы не сможете позволить себе графический процессор.

Я делаю Kaggle: RTX 3070.

Я участвую в соревнованиях по компьютерному зрению, предварительному обучению или исследованию машинного перевода : 4x RTX 3090. Подождите, пока не подтвердятся рабочие сборки с хорошим охлаждением и достаточной мощностью (я обновлю это сообщение в блоге).

Я исследователь НЛП : Если вы не работаете над машинным переводом, языковым моделированием или каким-либо предварительным обучением, RTX 3080 будет достаточно и экономически эффективным.

Я начал глубокое обучение и серьезно отношусь к этому : Начните с RTX 3070.Если через 6-9 месяцев вы все еще настроены серьезно, продайте свой RTX 3070 и купите 4x RTX 3080. В зависимости от того, какую область вы выберете следующей (запуск, Kaggle, исследования, прикладное глубокое обучение), продайте свои графические процессоры и купите что-то более подходящее после около трех лет (графические процессоры RTX 40s следующего поколения).

Я хочу попробовать глубокое обучение, но не отношусь к этому серьезно. : RTX 2060 Super превосходен, но может потребоваться новый блок питания. Если на вашей материнской плате есть слот PCIe x16 и у вас есть блок питания мощностью около 300 Вт, GTX 1050 Ti — отличный вариант, поскольку для работы с настольным компьютером не требуются какие-либо другие компьютерные компоненты.

Кластер графических процессоров, используемый для параллельных моделей с менее чем 128 графическими процессорами: Если вам разрешено покупать графические процессоры RTX для вашего кластера: 66% 8x RTX 3080 и 33% 8x RTX 3090 (только если достаточное охлаждение гарантировано / подтверждено). Если охлаждения RTX 3090s недостаточно, купите 33% графических процессоров RTX 6000 или 8x Tesla A100. Если вам не разрешено покупать графические процессоры RTX, я бы, вероятно, выбрал 8 узлов A100 Supermicro или 8 узлов RTX 6000.

Кластер графического процессора, используемый для параллельных моделей на 128 графических процессорах: Подумайте о 8x конфигурациях Tesla A100.Если вы используете более 512 графических процессоров, вам следует подумать о приобретении системы DGX A100 SuperPOD, которая соответствует вашим масштабам.

История версий

  • 2020-09-20: Добавлено обсуждение использования ограничения мощности для запуска систем с 4x RTX 3090. Добавлены старые графические процессоры в графики производительности и цены / производительности. Добавлены цифры для умножения разреженных матриц.
  • 07.09.2020: Добавлены графические процессоры серии NVIDIA Ampere. Включено множество полезных деталей о графическом процессоре.
  • 03.04.2019: Добавлены RTX Titan и GTX 1660 Ti.Обновлен раздел TPU. Добавлено обсуждение оборудования для запуска.
  • 26.11.2018: Добавлено обсуждение проблем с перегревом карт RTX.
  • 05.11.2018: Добавлен RTX 2070 и обновлены рекомендации. Обновленные диаграммы с точными данными о производительности. Обновлен раздел TPU.
  • 21.08.2018: Добавлены RTX 2080 и RTX 2080 Ti; переработан анализ производительности
  • 09.04.2017: Добавлен анализ рентабельности; обновленная рекомендация с NVIDIA Titan Xp
  • 19 марта 2017 г .: Очищено сообщение в блоге; добавлен GTX 1080 Ti
  • 23.07.2016: добавлены Titan X Pascal и GTX 1060; обновлены рекомендации
  • 25.06.2016: Переработан раздел multi-GPU; удален простой раздел памяти нейронной сети как больше не актуальный; расширенная секция сверточной памяти; обрезанный раздел AWS из-за того, что он больше не работает; добавил свое мнение о Xeon Phi; добавлены обновления для серии GTX 1000
  • 20.08.2015: Добавлен раздел для экземпляров AWS GPU; добавлена ​​GTX 980 Ti в сравнение
  • 22.04.2015: GTX 580 больше не рекомендуется; добавлены взаимосвязи производительности между картами
  • 2015-03-16: Обновлены рекомендации по графическому процессору: GTX 970 и GTX 580
  • 23.02.2015: обновлены рекомендации по графическому процессору и расчеты памяти
  • 28.09.2014: добавлен акцент на требования к памяти для CNNs

Благодарности

Я хочу поблагодарить Агрина Хильмкила, Ари Хольцмана, Габриэля Ильхарко, Нам Фо за их превосходные отзывы о текущей версии этого сообщения в блоге.

За прошлые обновления этого сообщения в блоге я хочу поблагодарить Мэта Келси за помощь в отладке и тестировании пользовательского кода для GTX 970; Я хочу поблагодарить Сандера Дилемана за то, что он сообщил мне о недостатках моего совета по памяти GPU для сверточных сетей; Я хочу поблагодарить Ханнеса Бретшнайдера за указание на проблемы с программной зависимостью GTX 580; и я хочу поблагодарить Оливера Гризеля за то, что он указал на решения для ноутбуков для экземпляров AWS.

Leave a comment