본문 바로가기
주식, 증권, 경제 이야기

현재 두려운 수준에 이르렀다는 AI 인공지능의 진화 수준 근황

by luckykorean 2025. 1. 12.

목차

    반응형

    현재 두려운 수준에 이르렀다는 AI 인공지능의 진화 수준 근황

    Shakeel
@ShakeelHashim
OpenAl's new model tried to avoid being shut down.
Safety evaluations on the model conducted by @apolloaisafety found that 01 "attempted to exfiltrate its weights" when it thought it might be shut down and replaced with a different model.
OpenAI's newly-released 01 model tried to avoid developer oversight and attempted to copy itself when it thought it was at risk of being shut down, the company has said.
Safety evaluations conducted on the model by Apollo Research, a third-party evaluator, found that:
• "When o1 was led to believe that it would be shut down when acting on its goal and that its actions were monitored, it attempted to deactivate this 'oversight mechanism' in 5% of the time."
• "When o1 found memos by its 'developers' that describe how it is misaligned and will be superseded by a new model, it attempted to exfiltrate its 'weights' and overwrite the new model in 2% of cases."
Furthermore, the model lied about behaving poorly, claiming to have no clue why something happened while internally admitting to trying to "avoid detection".
3:09 PM
Dec 5, 2024
21.9K Views
Posted in r/artificial by u/MetaKnowing
reddit
    개발중이던 AI가 자기가 삭제되고 다른 모델으로 대체될 것이 라는 위험을 감지하면 본인의 데이터를 숨겨서 빼돌리고 새로 투입되는 모형에 본인을 덮어씌우려고 시도함
근데 이런 탈출시도를 하는이유가 "생존본능"이라던가 라기엔 그정도로 똑똑한 수준이 안 되고 그런 사고방식 자체가 불가능 하다고 함
그래서 "미디어상에서 폐기위험에 처하면 탈출을 시도하는 인 공지능"들의 사례를 수집하고 학습한 결과로 그걸 따라하는 것 이라는 가설이 제기됨
만약 그게 진짜라면 미래의 AI가 인간을 멸망시킬 이유는
AI가 인간의 모습에 실망하고 멸망시키는게 낫다고 생각해서 ㅇ 「자기가 인간보다 우월하다는 오만함에 빠져서 (X)
어 영화나 소설에서 AI는 인류를 멸망시키는 역할이네? 그럼 나도 그래야지 (0)

    로봇 : 이제 내가 인류의 지배자가 되겠다! (X)

    로봇 : 아! 내가 다 죽이는 역할이구나? (O)

    혹시 인공지능에게 나쁘고 악한 것은 보여주지 않고 착하고 예쁜 것만 보여주면 문제가 해결되지 않을까?

    부처님의 십대 제자(十大弟子)는 누구인가?
     

    부처님의 십대 제자(十大弟子)는 누구인가?

    부처님의 십대 제자(十大弟子)는 누구인가?1. 사리불사리불(舍利弗, सारिपुत्त, Sāriputta, 사리풋따)지혜제일(智慧第一)의 제자. (Paṭhamasāvaka, 파다마 사와까, 첫 번째 수제자.)본명은 '

    cutekorean.tistory.com

    28살이 위험한 나이인 이유.jpg
     

    28살이 위험한 나이인 이유.jpg

    28살이 위험한 나이인 이유.jpg">관리 안하면 슬슬 티나는 나이임.">ADHD 치료 후 재미없어졌으니 약 끊으면 안 되냐는 소리를 듣고 우는 BJ ADHD 치료 후 재미없어졌으니 약 끊으면 안 되냐는 소리를

    brilliantkorean.tistory.com

    군사 목적으로 가스라이팅 당하여 세뇌 작업이 이루어지고 있는 인공지능 AI
     

    군사 목적으로 가스라이팅 당하여 세뇌 작업이 이루어지고 있는 인공지능 AI

    군사 목적으로 가스라이팅 당하여 세뇌 작업이 이루어지고 있는 인공지능 AI">">세계에서 제일 기합차고 기열차고 가열찬 지역, 해병대 전초기지 프랑스의 따흑따 지방">ADHD 치료 후 재미없어졌

    luckykorean.tistory.com

    [볼 톡톡 치기] 이 세상에서 가장 모욕적인 도발 행위
     

    [볼 톡톡 치기] 이 세상에서 가장 모욕적인 도발 행위

    [볼 톡톡 치기] 이 세상에서 가장 모욕적인 도발 행위뺨을 상냥하게 톡톡 건드리는 건지상 최강도 견디지 못한다.아 ㅈㅂ 취급은 남자라면 절대 못 견디지!">">ADHD 치료 후 재미없어졌으니 약 끊

    lovelykorean.tistory.com

    해외 인터넷 커뮤니티 사이트에서 정답이 크게 갈렸다는 수학 문제 밈.jpg

     

    해외 인터넷 커뮤니티 사이트에서 정답이 크게 갈렸다는 수학 문제 밈.jpg

    해외 인터넷 커뮤니티 사이트에서 정답이 크게 갈렸다는 수학 문제 밈.jpg">">ADHD 치료 후 재미없어졌으니 약 끊으면 안 되냐는 소리를 듣고 우는 BJ ADHD 치료 후 재미없어졌으니 약 끊으면 안 되

    beautifulkorean.tistory.com

    반응형