CUDA and ATI video Do not work together correctly

Message boards : Number crunching : CUDA and ATI video Do not work together correctly
Message board moderation

To post messages, you must log in.

1 · 2 · Next

AuthorMessage
Profile kararom
Volunteer tester

Send message
Joined: 10 Dec 08
Posts: 21
Credit: 42,084,829
RAC: 0
Russia
Message 962681 - Posted: 11 Jan 2010, 9:44:15 UTC

In my computer there are two videocards:

NVIDIA GPU 0: GeForce GTX 260 (driver version 19562, CUDA version 3000, compute capability 1.3, 896MB, 537 GFLOPS peak)

and

ATI GPU 0: ATI Radeon HD 4700/4800 (RV740/RV770) (CAL version 1.4.467, 1024MB, 1360 GFLOPS peak)
(ATI HD4890)

Processor: 4 GenuineIntel Intel(R) Core(TM)2 Quad CPU Q9650 @ 3.00GHz [EM64T Family 6 Model 23 Stepping 10]

I participate in two projects: SETI@home and Milkyway@home

If for Milkyway@home jobs (for ATI-card)are not present, jobs SETI-CUDA start to be considered not on a GPU, and on CPU. At arrival and the beginning of calculation of jobs for Milkyway - CUDA jobs again start to be considered on GPU.

My app_info.xml:
<app_info>
<app>
<name>setiathome_enhanced</name>
</app>
<file_info>
<name>MB_6.08_CUDA_V12_VLARKill_FPLim2048.exe</name>
<executable/>
</file_info>
<file_info>
<name>cudart.dll</name>
<executable/>
</file_info>
<file_info>
<name>cufft.dll</name>
<executable/>
</file_info>
<file_info>
<name>libfftw3f-3-1-1a_upx.dll</name>
<executable/>
</file_info>
<app_version>
<app_name>setiathome_enhanced</app_name>
<version_num>608</version_num>
<plan_class>CUDA</plan_class>
<avg_ncpus>0.04</avg_ncpus>
<max_ncpus>0.04</max_ncpus>
<coproc>
<type>CUDA</type>
<count>1</count>
</coproc>
<file_ref>
<file_name>MB_6.08_CUDA_V12_VLARKill_FPLim2048.exe</file_name>
<main_program/>
</file_ref>
<file_ref>
<file_name>cudart.dll</file_name>
</file_ref>
<file_ref>
<file_name>cufft.dll</file_name>
</file_ref>
<file_ref>
<file_name>libfftw3f-3-1-1a_upx.dll</file_name>
</file_ref>
</app_version>
</app_info>

Whether there are ideas as it can be corrected (that jobs for CUDA would not be considered on CPU during absence of jobs for Milkyway@home)?

In advance thanks

P.S: sorry for my english
ID: 962681 · Report as offensive
Profile skildude
Avatar

Send message
Joined: 4 Oct 00
Posts: 9541
Credit: 50,759,529
RAC: 60
Yemen
Message 962706 - Posted: 11 Jan 2010, 15:38:22 UTC - in response to Message 962681.  

I'm not aware if Nvidia and ATI cards can run together. I'd think not. Since it would require having 2 different video drivers going at the same time. I think you are asking boinc and your OS to be smarter than they are. IF you had matching GPU's you still would wind up at the mercy of the BOINC manager for what it processed.

Just for giggles could you show us the first 20-30 lines of messages in your boinc manager.


In a rich man's house there is no place to spit but his face.
Diogenes Of Sinope
ID: 962706 · Report as offensive
Profile kararom
Volunteer tester

Send message
Joined: 10 Dec 08
Posts: 21
Credit: 42,084,829
RAC: 0
Russia
Message 962710 - Posted: 11 Jan 2010, 15:53:00 UTC
Last modified: 11 Jan 2010, 15:55:53 UTC

11.01.2010 18:55:06 Starting BOINC client version 6.10.24 for windows_x86_64
11.01.2010 18:55:06 log flags: file_xfer, sched_ops, task
11.01.2010 18:55:06 Libraries: libcurl/7.19.7 OpenSSL/0.9.8l zlib/1.2.3
11.01.2010 18:55:06 Running as a daemon
11.01.2010 18:55:06 Data directory: C:\Documents and Settings\All Users\Application Data\BOINC
11.01.2010 18:55:06 Running under account boinc_master
11.01.2010 18:55:06 Processor: 4 GenuineIntel Intel(R) Core(TM)2 Quad CPU Q9650 @ 3.00GHz [EM64T Family 6 Model 23 Stepping 10]
11.01.2010 18:55:06 Processor: 6.00 MB cache
11.01.2010 18:55:06 Processor features: fpu tsc pae nx sse sse2
11.01.2010 18:55:06 OS: Microsoft Windows XP: Professional x64 Edition, Service Pack 2, (05.02.3790.00)
11.01.2010 18:55:06 Memory: 8.00 GB physical, 7.58 GB virtual
11.01.2010 18:55:06 Disk: 596.17 GB total, 580.70 GB free
11.01.2010 18:55:06 Local time is UTC +3 hours
11.01.2010 18:55:06 NVIDIA GPU 0: GeForce GTX 260 (driver version 19562, CUDA version 3000, compute capability 1.3, 896MB, 537 GFLOPS peak)
11.01.2010 18:55:06 ATI GPU 0: ATI Radeon HD 4700/4800 (RV740/RV770) (CAL version 1.4.467, 1024MB, 1360 GFLOPS peak)
11.01.2010 18:55:06 Milkyway@home Found app_info.xml; using anonymous platform
11.01.2010 18:55:06 SETI@home Found app_info.xml; using anonymous platform
11.01.2010 18:55:07 Einstein@Home URL http://einstein.phys.uwm.edu/; Computer ID 2134817; resource share 100
11.01.2010 18:55:07 Hydrogen@Home URL http://hydrogenathome.org/; Computer ID 13636; resource share 100
11.01.2010 18:55:07 Milkyway@home URL http://milkyway.cs.rpi.edu/milkyway/; Computer ID 113321; resource share 100
11.01.2010 18:55:07 orbit@home URL http://orbit.psi.edu/oah/; Computer ID 21990; resource share 100
11.01.2010 18:55:07 SETI@home URL http://setiathome.berkeley.edu/; Computer ID 5140210; resource share 100
11.01.2010 18:55:07 Cosmology@Home URL http://www.cosmologyathome.org/; Computer ID 66251; resource share 100
11.01.2010 18:55:07 Cosmology@Home General prefs: from Cosmology@Home (last modified 23-Nov-2009 00:58:20)
11.01.2010 18:55:07 Cosmology@Home Host location: none
11.01.2010 18:55:07 Cosmology@Home General prefs: using your defaults
11.01.2010 18:55:07 Reading preferences override file
11.01.2010 18:55:07 Preferences:
11.01.2010 18:55:07 max memory usage when active: 8190.74MB
11.01.2010 18:55:07 max memory usage when idle: 8190.74MB
11.01.2010 18:55:07 max disk usage: 149.04GB
11.01.2010 18:55:07 (to change, visit the web site of an attached project,
11.01.2010 18:55:07 or click on Preferences)
11.01.2010 18:55:07 Using proxy info from GUI
11.01.2010 18:55:07 Not using a proxy
11.01.2010 18:55:07 Cosmology@Home Restarting task wu_010510_211755_2_0_0 using camb version 216
11.01.2010 18:55:07 Cosmology@Home Restarting task wu_010510_211856_1_0_0 using camb version 216
11.01.2010 18:55:07 Cosmology@Home Restarting task wu_010510_211903_0_0_0 using camb version 216
11.01.2010 18:55:07 Cosmology@Home Restarting task wu_122209_033131_1_1_1 using camb version 216
11.01.2010 18:55:07 SETI@home Restarting task 31dc06ab.12133.8661.4.10.14_0 using setiathome_enhanced version 608
11.01.2010 18:55:12 Milkyway@home Sending scheduler request: To report completed tasks.
11.01.2010 18:55:12 Milkyway@home Reporting 1 completed tasks, requesting new tasks for GPU
11.01.2010 18:55:17 Milkyway@home Scheduler request completed: got 0 new tasks
11.01.2010 18:55:17 Milkyway@home Message from server: No work sent
ID: 962710 · Report as offensive
Profile Gundolf Jahn

Send message
Joined: 19 Sep 00
Posts: 3184
Credit: 446,358
RAC: 0
Germany
Message 962713 - Posted: 11 Jan 2010, 15:55:13 UTC - in response to Message 962710.  

No, skildude was speaking of the first lines after a restart of the BOINC client or after a reboot.

Gruß,
Gundolf
ID: 962713 · Report as offensive
Profile kararom
Volunteer tester

Send message
Joined: 10 Dec 08
Posts: 21
Credit: 42,084,829
RAC: 0
Russia
Message 962714 - Posted: 11 Jan 2010, 15:57:45 UTC

OK, has corrected...
ID: 962714 · Report as offensive
Profile Raistmer
Volunteer developer
Volunteer tester
Avatar

Send message
Joined: 16 Jun 01
Posts: 6325
Credit: 106,370,077
RAC: 121
Russia
Message 962720 - Posted: 11 Jan 2010, 16:27:07 UTC
Last modified: 11 Jan 2010, 16:46:53 UTC

@kararom
Опиши, плиз, более детально что именно происходит?
Если есть работа для MW, то SETI на ГПУ вообще не считаются? BOINC что при этом пишет в разделе статус заданий? Уже загруженные задания для нВидиа карточки куда деваются и какой их статус, когда АТИшная карточка имеет работу?
P.S. И как задания для SETI могут попадать на ЦПУ ? В приведенном app_info вообще нет программы для счета на процессоре, только ГПУшная прога.
P.P.S. Посмотрел результаты для этого хоста - вроде как работает карточка нВидиа.
Ошибки в основном только при отбрасывании заданий с очень малым малых углом обзора. Единственная проблема, какую я вижу - очень плохое соотношение между временем ЦПУ и полным затраченным. ЦПУ время всего лишь в 2 раза меньше, а должно было бы быть гораздо меньше.
Проблема в этом или что-то я упустил?
ID: 962720 · Report as offensive
Profile kararom
Volunteer tester

Send message
Joined: 10 Dec 08
Posts: 21
Credit: 42,084,829
RAC: 0
Russia
Message 962722 - Posted: 11 Jan 2010, 16:44:53 UTC
Last modified: 11 Jan 2010, 16:46:15 UTC

Если Milkyway@home имеет задания для работы (расчёт ведётся только на ATI-карте) - всё считается корректно:

Cosmology@home на 4-х ядрах процессора;
Milkyway@home на ATI-карте;
SETI@home на GTX260.

Если же задания для Milkyway@home отсутствуют к обработке - CUDA-задание для SETI@home автоматически начинает считаться на процессоре, отбирая ресурсы у одного из заданий Cosmology@home. При этом в BOINC менеджере в закладке "Сообщения" вообще ничего не меняется (как будто ничего и не произошло). В Статус задания никаких изменений не происходит. Изменения видны в Диспетчере задач Windows (SETI-задание начинает забирать полностью ресурсы одного ядра ЦП (24-25% всего ЦП)) и, на глаз, в резко упавшей скорости обработки CUDA-задания. При этом расчёт Cosmology-задания не приостанавливается - просто на него уходит 1-3% мощности ЦП вместо 24-25%.

Причём это происходит как при применении отимизированного приложения (MB_6.08_CUDA_V12_VLARKill_FPLim2048.exe), так и "родного" (setiathome_6.09_windows_intelx86__cuda23.exe).
ID: 962722 · Report as offensive
Profile dnolan
Avatar

Send message
Joined: 30 Aug 01
Posts: 1228
Credit: 47,779,411
RAC: 32
United States
Message 962723 - Posted: 11 Jan 2010, 16:45:46 UTC - in response to Message 962706.  

I'm not aware if Nvidia and ATI cards can run together.


They can. I have a 9800GTX+ and an HD 4850 in one of my machines, this one. I have not seen the issue that the OP has, but I am doing this on Win7 (32bit) and the OP is XP 64, I think.
Maybe related to driver versions? I am using 9.11 (no CCC) for the ATI, and 191.07 for the Nvidia.

-Dave
ID: 962723 · Report as offensive
Profile kararom
Volunteer tester

Send message
Joined: 10 Dec 08
Posts: 21
Credit: 42,084,829
RAC: 0
Russia
Message 962724 - Posted: 11 Jan 2010, 16:48:29 UTC

Hmmm... Driver problem?... may be... may be...
ID: 962724 · Report as offensive
Profile Raistmer
Volunteer developer
Volunteer tester
Avatar

Send message
Joined: 16 Jun 01
Posts: 6325
Credit: 106,370,077
RAC: 121
Russia
Message 962725 - Posted: 11 Jan 2010, 16:49:27 UTC - in response to Message 962722.  


Если же задания для Milkyway@home отсутствуют к обработке - CUDA-задание для SETI@home автоматически начинает считаться на процессоре, отбирая ресурсы у одного из заданий Cosmology@home.

Ссылку на один-два результата, посчитанных таким образом, привести можешь, плиз?

ID: 962725 · Report as offensive
Profile zoom3+1=4
Volunteer tester
Avatar

Send message
Joined: 30 Nov 03
Posts: 65709
Credit: 55,293,173
RAC: 49
United States
Message 962728 - Posted: 11 Jan 2010, 17:03:18 UTC - in response to Message 962723.  
Last modified: 11 Jan 2010, 17:24:06 UTC

I'm not aware if Nvidia and ATI cards can run together.


They can. I have a 9800GTX+ and an HD 4850 in one of my machines, this one. I have not seen the issue that the OP has, but I am doing this on Win7 (32bit) and the OP is XP 64, I think.
Maybe related to driver versions? I am using 9.11 (no CCC) for the ATI, and 191.07 for the Nvidia.

-Dave

I have an ATi video card embedded in My HP m7470n AMD PC(2.0GHz 4200+ s939 cpu) that's a part of the motherboard and a GTX295 in the 16x pci-e slot and after a few hours the GTX295 started spitting up errors, As to the embedded ATi card(Disabled w/no ATi video driver loaded), HP made sure that It could never be turned off in the Bios and until It can, The HP is not suitable for crunching with any Nvidia card, So It's going to be used as My spare TV as that's It's primary function really.
The T1 Trust, PRR T1 Class 4-4-4-4 #5550, 1 of America's First HST's
ID: 962728 · Report as offensive
Profile kararom
Volunteer tester

Send message
Joined: 10 Dec 08
Posts: 21
Credit: 42,084,829
RAC: 0
Russia
Message 962731 - Posted: 11 Jan 2010, 17:22:33 UTC
Last modified: 11 Jan 2010, 17:30:59 UTC

В списке готовых и отправленных заданий не могу их найти :(

Задание 29dc06ab.9250.6616.15.10.241_1_1 (если это может помочь) (отправил готовое примерно в 20.08 по Москве). Переключалось с GPU на CPU неоднократно, общее время расчёта около 15 минут.

Следующее: 29dc06ab.9250.6616.15.10.237_0_2 (готовое отправлено 20.19 по Москве). Так же переключалось туда-сюда неоднократно.

P.S.: расчёт вёлся на "родном" приложении, host ID 5140210 (karacomp)

P.P.S.: как задания для GPU попадают (даже без всяких app_info) на CPU я тоже не понимаю (в том-то и фишка). Возможно они не полностью с GPU слетают, а просто основное бремя, при отсутствии заданий для Милки, почему-то перекладывается на CPU, соответственно и соотношение времени такое плохое (и, соответственно полное время расчёта задания (процессор, всё же, считает значительно медленнее)).
ID: 962731 · Report as offensive
Profile skildude
Avatar

Send message
Joined: 4 Oct 00
Posts: 9541
Credit: 50,759,529
RAC: 60
Yemen
Message 962738 - Posted: 11 Jan 2010, 18:00:17 UTC - in response to Message 962731.  

I'm not able to read cyrillic. However, I'm wondering if a CC_config is used. If not shouldnt one be set to "use_all_gpu 1"


In a rich man's house there is no place to spit but his face.
Diogenes Of Sinope
ID: 962738 · Report as offensive
Profile kararom
Volunteer tester

Send message
Joined: 10 Dec 08
Posts: 21
Credit: 42,084,829
RAC: 0
Russia
Message 962744 - Posted: 11 Jan 2010, 18:27:14 UTC

I do not use CC_config. Whether It is impossible to tell more in detail about "set to" use_all_gpu 1 "?
ID: 962744 · Report as offensive
Profile Raistmer
Volunteer developer
Volunteer tester
Avatar

Send message
Joined: 16 Jun 01
Posts: 6325
Credit: 106,370,077
RAC: 121
Russia
Message 962745 - Posted: 11 Jan 2010, 18:32:03 UTC - in response to Message 962731.  

Задание 29dc06ab.9250.6616.15.10.241_1_1 (если это может помочь) (отправил готовое примерно в 20.08 по Москве). Переключалось с GPU на CPU неоднократно, общее время расчёта около 15 минут.


С этим никаких проблем кроме времени счета. CPU fallback как такового не было. Видимо действительно траблы с драйверами. Когда я запускаю 2 задания на одном ГПУ - тоже вижу чрезмерно большое увеличение ЦПУ времени хотя суммарное время всего в 2 раза увеличивается как и должно по идее. Видимо в программе крутится цикл ожидания события некоторого, а иногда его приходится ждать дольше обычного. т.К. обе карточки используют одну шину - возможно драйвер от нВидиа ждет вместо своего событие от атишной карточки.... короче менять драйверы, попробовать на другие прерывания карточки посадить, либо ОС сменить. сама программа в порядке и BOINC тоже думаю...

Perhaps it's bad drivers or bad GPU IRQs combo...
ID: 962745 · Report as offensive
Profile Raistmer
Volunteer developer
Volunteer tester
Avatar

Send message
Joined: 16 Jun 01
Posts: 6325
Credit: 106,370,077
RAC: 121
Russia
Message 962747 - Posted: 11 Jan 2010, 18:34:02 UTC - in response to Message 962744.  

I do not use CC_config. Whether It is impossible to tell more in detail about "set to" use_all_gpu 1 "?

it will not help. BOINC sees both GPUs, BOINC allocates work for both GPUs, CUDA MB sees GPU, it starts on that GPU. Lower-level problems here IMO, not BOINC related.
ID: 962747 · Report as offensive
Profile kararom
Volunteer tester

Send message
Joined: 10 Dec 08
Posts: 21
Credit: 42,084,829
RAC: 0
Russia
Message 962748 - Posted: 11 Jan 2010, 18:38:16 UTC

Спасибо! Буду экспериментировать с драйверами (ОС и прерывания не буду менять - сложновато это всё. Две карты одновременно и так встали с трудом).

ОК, thanks for the help! I will experiment drivers.
ID: 962748 · Report as offensive
Profile Raistmer
Volunteer developer
Volunteer tester
Avatar

Send message
Joined: 16 Jun 01
Posts: 6325
Credit: 106,370,077
RAC: 121
Russia
Message 962751 - Posted: 11 Jan 2010, 18:47:31 UTC - in response to Message 962748.  

Спасибо! Буду экспериментировать с драйверами (ОС и прерывания не буду менять - сложновато это всё. Две карты одновременно и так встали с трудом).

ОК, thanks for the help! I will experiment drivers.

Да не за что :) Насчет что сложно - не то слово, у меня пока 2 разных карточки (встроенная и нвидиа) вообще вместе работать не хотят...
ID: 962751 · Report as offensive
Profile kararom
Volunteer tester

Send message
Joined: 10 Dec 08
Posts: 21
Credit: 42,084,829
RAC: 0
Russia
Message 962754 - Posted: 11 Jan 2010, 18:57:16 UTC

А как можно сразу два задания SETI запустить на CUDA-карте (ПЕЧ260, например)?
ID: 962754 · Report as offensive
Profile Raistmer
Volunteer developer
Volunteer tester
Avatar

Send message
Joined: 16 Jun 01
Posts: 6325
Credit: 106,370,077
RAC: 121
Russia
Message 962755 - Posted: 11 Jan 2010, 19:00:53 UTC - in response to Message 962754.  
Last modified: 11 Jan 2010, 19:06:07 UTC

А как можно сразу два задания SETI запустить на CUDA-карте (ПЕЧ260, например)?

Я в оффлайн тесте пускал, без BOINC. А вообще можно прописать дробное, нпример 0,5 число в поле coproc в app_info. Только для моей медленной 9400GT это никаких преимуществ не дало, только ЦПУ время увеличилось сильно. Для быстрой карточки может и стоит попробовать....

Кстати, для не Ферми карточек кьюда 3 и 195 серия драйверов - перебор. Быстрее не будет, так что можешь попробовать к 190 или 191 серии драйверов вернуться и кьюда 2.3

ЗЫ
<coproc>
<type>CUDA</type>
<count>1(вот тут 0,5 вместо1)</count>
</coproc>
ID: 962755 · Report as offensive
1 · 2 · Next

Message boards : Number crunching : CUDA and ATI video Do not work together correctly


 
©2024 University of California
 
SETI@home and Astropulse are funded by grants from the National Science Foundation, NASA, and donations from SETI@home volunteers. AstroPulse is funded in part by the NSF through grant AST-0307956.