인공지능의 핵심 키워드 LLM

2023. 4. 25. 20:07인공지능 개요

반응형

LLM (Large Language Model) 의 정의 

ChatGPT는 RLHFF(Reinforcement Learning from Human Feedback : 사람이 반응하여 결과를 만들어냄) 라는 특정 유형의 가오하 학습을 사용하지만 높은 수준에서 (Large Language Model) 의 예입니다. 출처 : 경남ICT협회(AI연구회)

 

대화 또는 기타 자연 언어 입력에 대해 인간과 유사한 응답을 생성하기 위해 방대한 양의 텍스트 데이터(읽기: ChatGPT의 경우 전체 인터넷)에 대해 훈련된 인공 지능의 하위 집합입니다. 이러한 자연어 응답을 생성하기 위해 LLM은 다층 신경망을 사용하여 복잡한 데이터를 처리, 분석 및 예측하는 심층 학습 모델을 사용합니다. LLM은 종종 인간의 텍스트와 구별할 수 없는 고품질의 일관된 텍스트를 생성하는 능력이 독특합니다.

 

대규모 언어모델은 학습된 지식을 통한 AI 분야의 혁신적인 변화를 약속하며 해당 분야의 큰 발전을 보여주었습니다. LLM의 크기는 매년 10배씩 증가해 왔으며 모델의 복잡성 및 크기가 커짐에 따라 기능도 늘어나고 있습니다. 그러나 LLM 개발 유지 관리가 어려워 대부분의 기업은 LLM에 접근하기가 어렵습니다. 

 

LLM 의 주요 기능

텍스트 생성  마케팅 카피 및 스토리라인 제작용.

요약  뉴스 및 이메일용.

이미지 생성  브랜드 창작 및 게이밍 캐릭터용 (달리)

챗봇 지능형 Q&A 및 실시간 고객 지원용.

코딩 동적 코멘트 달기 및 기능 생성용.

번역 언어 및 위키피디아에서 사용.

 

반응형

 

 

LLM 중 하나는 OpenAI에서 개발한 Generative Pretrained Transformer 3의 약자인 GPT-3입니다.1,750억 개의 매개변수가 있는 GPT-3는 현재까지 가장 크고 강력한 LLM중 하나이며 번역, 요약 및 시 쓰기를 포함한 광범위한 자연어 작업을 처리할 수 있습니다. 

 

LLM에서 사용되는 주요 알고리즘

자연어 처리, 특히 LLM(대형 언어 모델) 분야는 이러한 AI 모델이 가능한 한 인간 언어에 가깝게 처리, 이해 및 출력할 수 있도록 하는 다양한 알고리즘에 의해 구동됩니다. 단어 임베딩, 어텐션 메커니즘 및 변환기를 포함하여 위에서 언급한 LLM에서 사용되는 몇 가지 주요 알고리즘을 좀 더 자세히 간략하게 살펴보겠습니다.

 

단어 임베딩은 단어의 의미를 숫자 형식으로 표현하는 데 사용되므로 LLM에서 사용되는 기본 알고리즘으로, AI 모델에서 처리할 수 있습니다. 이는 유사한 의미를 가진 단어가 서로 더 가깝게 위치하는 고차원 공간에서 단어를 벡터에 매핑하여 달성됩니다.

 

Attention Mechanisms 어텐션 메커니즘은 LLM의 또 다른 중요한 알고리즘으로, AI가 출력을 생성할 때 입력 텍스트의 특정 부분에 집중할 수 있도록 합니다. 이를 통해 LLM은 주어진 입력의 맥락이나 감정을 고려하여 보다 일관되고 정확한 응답을 얻을 수 있습니다.

 

Transformers 트랜스포머는 LLM 연구에서 널리 사용되는 신경망 아키텍처 유형입니다. 이러한 네트워크는 selfattention 메커니즘을 사용하여 입력 데이터를 처리하여 인간 언어의 장기적인 종속성을 효과적으로 캡처할 수 있습니다. 이러한 알고리즘은 LLM이 자연어 입력을 처리 및 이해하고 가능한 한 인간과 유사한 출력을 생성할 수 있도록 하므로 LLM의 성능에 매우 중요합니다.

 

LLM 의 문제점들이 나타나기 시작했는데 주요 논점은 환각,편견,동의,보안입니다. AI 는 hallucination 홀루시네이션으로 불리는 환각에 빠진 표현을 사용하는데 인간을 속이는 통계를 사용하고 있습니다. 이는 콜센터에 적용된 AI 가 잘못된 답변을 할 수 있다는 점입니다. 또한 편견을 보여주기도 하는데 학습이 잘못된 인공지능이 배우지 않은 부분에 대해 편향을 가진 의견을 제시할 수 있다는 점입니다. 동의는 저작권에 관한 문제일 수 있는데 프롬프터가 저작권에 대해 사전 조사를 하지 않고 질문시 AI는 저작권 문제는 고려하지 않고 답변을 할 수 있다는 점입니다. 마지막으로 보안입니다. 악의적인 프로그래머의 침입으로 인공지능은 보안에 문제가 발생하여 문제를 일으킬 수 있다는 점입니다. 

 

정확한 예제를 제시하지 않는다면 LLM은 인간에게 악영향을 끼칠 수 있으므로 이 점을 보완한 문제 해결책을 제시하여야 합니다. 

 

LLM(Large LanguageModels)은 인공 지능 분야에서 흥미로운 발전이며 ChatGPT가 입소문이 나면서 앞으로 몇 년 동안 일상 생활에서의 사용이 증가할 것 같습니다. 해결해야 할 문제와 윤리적 고려 사항이 분명히 있지만 LLM의 잠재적 용도는 방대하고 다양합니다.

 

 

반응형