본문 바로가기
영어/TIMES

No One Truly Knows How AI Systems Work. A New Discovery Could Change That

by ornni 2024. 6. 3.
728x90
반응형
No One Truly Knows How AI Systems Work. A New Discovery Could Change That
MAY 21, 2024 11:00 AM EDT

사실 나도 AI를 공부하는 사람으로써, 데이터 분석의 결과나 모델링 코드는 알고 있지만 안에 어떻게 돌아가는지, 안전성은 어떤지 잘 모른다. 명확한 과정과 답을 고민하는 것에 성취감을 느끼는 사람으로써 늘 답답한 부분이기도 했다.

 

근데 이 뉴스는 이제 AI의 내부를 볼 수 있고, 뉴런을 억압하는 방법을 통해 안전성을 확인할 수 있다는 뉴스였다.

 

아직은 작은 모델에서 시작하고 많이 나아가지 못했지만 금방 큰 모델에 내부를 파악하고 안전성을 파악할 수 있을 가능성이 보여 이제 AI의 내부 실체를 더 명확히 파악할 수 있을 것이다. 큰 기대가 보이는 뉴스였다.


explicit 명백한

feed in 먹이다

spot 찾아내다

opaque 불투명체

 

loom 다가오다

 

breakthrough 돌파구

 

stimulate 자극하다

exploit 악용되다

vulnerability 취약성

suppress 억압하다

 

implication 함축

fraudulent 사기적인

speculative 위험한

wreak 가하다

havoc 큰 파란

 

intervention 간섭

 

struck 치다

optimistic 낙관적인

promising 유망한

 

peer into 들여보내다

 

fire 활성화되다

disparate as 서로 다른

indeication 표시

 

nowhere 아무데도

manipulate 조종하다

 

utility 유용

esoteric 난해한


링크

https://time.com/6980210/anthropic-interpretability-ai-safety-research/

 

Artificial Intelligence Is a 'Black Box.' Maybe Not For Long

A new breakthrough by researchers at Anthropic could pave the way for safer AI systems.

time.com

 

반응형