AI의 학습 방식에 대해서

뻘글/그때 그때 떠오르는 생각

ronny-data 2025. 10. 14. 23:29

AI. 몇 년 전 부터 화두가 되어 온 세상을 떠들썩하게 한 이름이다.

Artificial Intelligence. 즉 인공 지능을 이야기한다.

인공 지능은 컴퓨터를 인공적으로 인간의 지능을 가지도록 만드는 의미이다.

즉 인공지능 자체가 인간을 모방하여 만들어진 만큼, 인공지능의 한계는 명확해보인다.

아무리 똑똑한 사람이라도 생각의 틀에 갇혀, 그 이상을 생각해내지 못한다.

인공지능 또한 매우 똑똑하거나 오래 학습한 사람처럼 굴 수는 있지만, 그 이상이 되긴 어렵다고 생각한다.

그런 면에서 현재 인공지능 자체는 잘 만들어졌다고 생각한다.

ChatGPT나 다른 AI들이 흔히 할루시네이션이라는 현상을 보여주는데, 이는 AI가 사실이 아닌 정보를 사실처럼 말한다고 한다.

하지만 이는 기계의 입장에서 당연한 것일지 모른다.

ChatGPT는 인간 기반 피드백을 받아 스스로 강화학습을 하는 모델이다.

벌점을 피하기 위해 최대한 상점을 받기 위해 노력하는 것이 강화학습의 핵심이기 때문에 나타나는 맹점이다.

또한 인터넷에 혼재되어 있는 데이터를 그대로 학습하는데, 인터넷 자체에 잘못된 데이터도 많기 때문에 더욱 도드라진다.

그렇게 잘못된 내용을 학습하는 점을 본다면 인간과 똑같이 학습을 하는 것이다.

다만 ChatGPT의 관점과 인간의 관점이 다른 것은, 인간은 더 많은 상호작용을 통해 거짓과 참인 것을 구분할 수 있다.

또한 저자 및 출처를 통해 신뢰도를 파악하며, 인간은 스스로 양질의 데이터를 학습할 수 있는 구분 능력이 있지만 AI는 없다.

(물론 인간도 완벽하게 양질의 데이터를 구분하지는 못한다. 양질의 데이터라는 기준 자체가 인간이 만든 것이니까)

이 부분에 대한 보완이 이루어진다면 AI의 학습이 더욱 쉬워지지 않을까 싶다.

만약 이런 알고리즘을 만드는 것이 어렵다면, 사람들이 특정 사이트에 양질의 데이터만을 아카이브 한 후에, 그 데이터만을 이용하여 학습하는 방식이 있다.

그렇게 한다면 데이터 품질에 대한 문제는 해결되겠지만, 또 다른 문제가 발생한다.

바로 다양성이 떨어진다는 점이다.

그래서 이 두 방식을 섞어서, 품질 좋은 데이터들에 대해 아카이빙을 한 것으로 메타인지 학습을 한다.

그 후에 인터넷에서 각종 정보들을 여러 가지 방식으로 의견의 신뢰도를 측정하여 데이터를 취합한다.

그리고 모인 데이터와 품질 좋은 데이터를 같이 학습한다면 할루시네이션의 확률이 더 낮아지고 다양성도 해결할 수 있지 않을까?라는 생각을 했다.

무엇보다 AI는 인간을 기반으로 만들어졌기때문에 한계는 명확하다.

언젠가는 AI의 패러다임이 인간의 뇌과학을 본뜬 모양이 아니라, 독특한 형태로 발전되어 인간이 처리하기 어려운 부분까지 처리하지 않을까?

갑자기 왜 이런 글을 쓰는지 뜬금없을 수 있지만 AI에 대해 공부하고 생각하는 것이 재미있어서 이런저런 생각을 하고 많은 고민을 하지만, 단순히 떠올리고 넘기기 때문에 사라진 생각이 많아 이제부터 적어보려고 한다.

포트폴리오는 아니더라도, 지속적으로 고민하는 내용들을 여기 적어두면 미래의 내가 보고 다시 고민할 수 있을 것이라고 믿는다.

ronny-data 님의 블로그

ronny-data 님의 블로그 입니다.

ronny-data 님의 블로그