WATCHDOG: GPU error 어쩌구 저쩌구...
접해보셨을 겁니다.
컴퓨터 공학 전문가가 아니어서 내부서 어떻게 구동이 되는지는 모르겠고,
채굴프로그램 개발자도 아니어서 대처가 불가하지만,
채굴기를 1년넘게 만지다보니 자꾸 심증이 갑니다.
GPU 코어는 문제가 없다.
그래픽메모리도 멀쩡하다.
OS도 잘 설치되었고, 업데이트도 잘 되었다.
애프터버너 같은 오버프로그램도 잘 동작한다.
그런데, WATCHDOG: GPU error... 뜬다.
그럼 와치독이 무엇인가 검색해 봤더니,
감시프로그램 혹은 프로그램에 혹은 OS에 속해있는 상태감시 알고리즘 쯤으로 이해가 되겠네요..
이 감시프로그램이 쿨러의 속도와 코어의 온도 체크에 많은 능력을 할당하는 바람에
GPU 본연의 능력에 문제가 없고, 쿨러가 빡쎄게 잘 돌고 있는데도 불구 하고
마이닝 프로그램을 불능 상태로 몰고 가는것 같다는 의심을 하게 됩니다.
특히, 와치독에러가 발생직전,
윈도우의 경우 작업관리자에서 성능을 보면 CPU를 꼭대기 끝까지 100%넘겨 못살게 만들고,
우분투에서 top으로 CPU로드에버리지를 보면 얼마나 과도하게 부하를 만들어내는지 눈으로 볼수 있습니다.
이더리움 채굴시 관리프로그램으로 3333 번 포트에 질의를 하면
코어의 온도와 쿨러의 수치, 카드별 해시값을 보여주는데,
이 와치독 알고리즘 혹은 프로그램이 온도와 쿨러의 상태를 점검하지 않는다면
기관차처럼 꾸준하고 지속적인 채굴이 가능하지 않을까 생각됩니다.
프로그램을 별도로 짜서 그 와치독을 무력화 시키거나
클레이모어 같은 프로그램에서 옵션에 온도와 쿨러스피드 체크등을 안하게 막을 옵션만 있다면
WATCHDOG: GPU error... 이런식의 에러로 마이닝프로그램이 멈추거나 재부팅되거나 하는 현상을
막을수 있지 않을까 생각해봅니다.
물론 쿨러가 안돌아서 코어에 심한 데미지나 아예 못쓰게 될 수도 있을 가능성이 있겠지만..
날씨가 더워졌을때 1년 내도록 쌩쌩돌던, 특히 겨울에는 멈추지 않는 채굴기들이
기온이 30도 넘어갔을때 WATCHDOG: GPU error.. 이런 에러를 뿜으며 멀쩡한 나머지 GPU 까지
동반으로 일을 못하게 먹통이 되어버리는 사태는 막을 수 있지 않을까...
기가바이트, 아수스 이런 모범생들은 그런일이 거의 없는데,
FORSA, ZOTAC 이런 애들은 빈번하게 발생을 하여 관리자의 손이가게 만드네요.
속상한것이 제소유의 그래픽카드 빈도가 높은 브랜드가 이런것들인지라..ㅠ
이런생각을 합니다.
WATCHDOG: GPU error...
이 와치독 꺼버릴수 없을까요?
코어나 메모리는 일을 잘할수 있는데, 감시프로그램들이 에러 조장을 하는 사태를 옵션으로 꺼버릴수는 없을까요?
이게 라이져카드를 교체해보세요, 오버값을 낮춰보세요, 가상메모리를 늘려보세요.. 등의 조언으로
원천적 해결이 안되네요...
두서없이 문제제기를 했봤는데, 컴퓨터구조에 대해 이해가 높으신 땡글인분들의 조언을 구해봅니다.
바닥없는 지속적인 하락장에 ㅠㅠㅠ 맘고생들 많으실텐데 화이팅 하시고, 좋은 답변부탁드립니다.
-------------------------------------
꼬리말
* 게시글 내용 삭제시 레벨 강등
* 질문은 각 주제별 게시판에.
비트코인 암호화화폐 커뮤니티 땡글~ 땡글~
-------------------------------------
..........