본문 바로가기

LLM

[LLM] 대형 언어 모델, LLM의 고급 활용 기술 소개 Introduction최근 몇 년간 OpenAI의 GPT 시리즈와 Huggingface 모델들 같은 대형 언어 모델(LLM)은 자연어 처리(NLP) 분야에서 혁신을 이끌어 왔습니다. 이 모델들은 방대한 양의 텍스트 데이터를 학습하여 텍스트 생성, 번역, 감정 분석 등 다양한 작업을 놀라운 수준으로 수행할 수 있습니다. LLM에 대한 자세한 설명은 다음 포스팅을 참고하시면 됩니다. [LLM] LLM이란?(Large Language Model)LLM(Large Language Model)대규모 언어 모델 이러한 모델들은 인공지능 분야에서 "텍스트 데이터를 이해하고 생성하는 데 사용"됩니다. LLM은 주로 수십억 개의 단어로부터 학습되며, 이를 통해 자연어yeonjinj.tistory.com 그러나 이러한 모.. 더보기
[langchain] Embeddings(임베딩)의 역할과 중요성 지난 포스팅에서 LangChain에 대해 소개했습니다.LangChain에 대해 더 알고 싶으시다면 아래 포스팅을 참고하시면 됩니다.  [LLM] LangChain이란?이전 포스팅에서 대규모 언어 모델(LLM)의 기능 및 활용 사례를 살펴보았습니다.  [LLM] LLM이란?(Large Language Model)LLM(Large Language Model)대규모 언어 모델 이러한 모델들은 인공지능 분야에서 "텍스트yeonjinj.tistory.com 이번 포스팅에서는 LangChain의 주요 구성 요소 중 하나인 embeddings에 대해 자세히 알아보겠습니다. LangChain은 다양한 NLP 및 ML 작업을 수행하는 데 필요한 강력한 도구들을 제공합니다. 주요 구성 요소로는 LLM (Large Lang.. 더보기
[langchain] LangChain에서 Prompt Template 사용하기 LangChain은 자연어 처리(NLP) 작업을 보다 효율적이고 효과적으로 수행할 수 있도록 설계된 프레임워크입니다. 이와 관련된 글은 다음 포스팅을 참고하시면 됩니다.  [LLM] LangChain이란?이전 포스팅에서 대규모 언어 모델(LLM)의 기능 및 활용 사례를 살펴보았습니다.  [LLM] LLM이란?(Large Language Model)LLM(Large Language Model)대규모 언어 모델 이러한 모델들은 인공지능 분야에서 "텍스트yeonjinj.tistory.com 이번 포스팅에서는 LangChain의 구성 요소 중 하나인 Prompt Template에 대해 자세히 살펴보겠습니다. Prompt Template언어 모델에게 특정한 방식으로 질문을 던지기 위해 사용되는 템플릿 이는 자연어.. 더보기
오픈AI 새 모델 'GPT-4o', 영화 Her의 실현? 오픈 AI가 우리 시간으로 5월 14일 화요일 새벽 2시, 새로운 플래그십 모델인 GPT-4o을 발표했습니다. 'o'는 'omni', 즉 모든이라는 뜻을 가지고 있다고 합니다.   이 모델은 사람처럼 보고, 듣고, 말하는 것은 물론, 감정까지 주고받을 수 있다고 합니다. 추가적으로 응답속도가 232밀리초로, 사람의 평균 답변 속도인 320밀리초보다 빠르다고 합니다. 지금까지의 언어모델은 이미지, 동영상, TTS 등의 분야가 각각 특화된 모델들이 존재했지만, GPT-4o에서는 멀티모달 능력을 통해 언어모델이 글자만을 이야기하는 것이 아니라 멀티미디어 작업을 수행할 수 있습니다.  GPT-4o의 개선사항그렇다면 GPT-4에 비해 어떤 점이 특히 개선되었을까요? 1. 속도 성능 개선GPT-4에 비해서 GPT-.. 더보기
[LLM] LLM이란?(Large Language Model) LLM(Large Language Model)대규모 언어 모델 이러한 모델들은 인공지능 분야에서 "텍스트 데이터를 이해하고 생성하는 데 사용"됩니다. LLM은 주로 수십억 개의 단어로부터 학습되며, 이를 통해 자연어를 이해하고 문장을 생성할 수 있는 능력을 개발합니다.  LLM의 예시 1. GPT 시리즈(OpenAI)LLM의 대표적인 예시라고 할 수 있죠. 2018년에 최초로 발표한 GPT-1을 시작으로, 현재는 GPT-4까지 출시되었습니다. GPT-5도 곧 나온다는 이야기가 있던데, 점점 성능이 좋아져서 기대하는 중입니다. 특히 GPT-4는 다양한 언어를 더 잘 이해하고, 복잡한 개념을 더 정확하게 처리할 수 있는 능력이 향상되었다는 특징이 있습니다. 모든 GPT 모델은 Transformer 아키텍처를.. 더보기
Llama3 출시 : 오픈소스 AI의 발전 지난 2024년 4월 18일, 메타(Meta)에서 라마3(Llama3)를 오픈소스로 공개했습니다. 공개한 모델은 총 두 가지, 8B, 70B. 400B Llama3 모델을 훈련 중이라고 합니다.  Llama3 의 성능  Llama3는 8B(80억) 매개변수임에도, Llama2 700억 매개변수에 비해 성능이 좋습니다.Llama2 70B도 공개 당시, 고성능 오픈소스 모델이라고 했는데 Llama3 8B는 훨씬 더 작은 규모임에도 더 나은 성능을 보이고 있습니다. 이전 오픈소스 모델 대비 성능  이전 오픈소스 모델 대비해서도 더 나은 성능 평가를 보이고 있습니다.오픈소스 LLM 으로 잘 알려져있는 Gemma, Mistral 모델들보다 성능이 더 좋게 나옵니다.심지어는 closed model인 Gemini P.. 더보기
데이터브릭스, 범용 LLM 'DBRX' 출시 데이터 및 인공지능(AI) 기업 데이터브릭스는 28일, 표준 벤치마크에서 모든 오픈소스 모델을 능가하는 범용 대형언어모델(LLM)인 DBRX를 오픈소스로 공개했다. DBRX는 모든 기업을 위해 맞춤형 고성능 LLM의 학습과 튜닝을 보편화한다. 조직은 DBRX를 통해 더 이상 소수의 폐쇄형 모델에 의존하지 않아도 된다. DBRX는 현재 사용 가능하며, 전 세계 조직은 비용 효율적으로 자체 맞춤형 LLM을 구축, 교육 및 서비스할 수 있다. DBRX는 언어 이해, 프로그래밍, 수학 및 논리 측면에서 Llama2-70B 및 Mixtral, Grok-1과 같은 기존 오픈소스 LLM보다 뛰어난 성능을 제공한다. 또한, DBRX는 대부분의 벤치마크에서 GPT-3.5의 성능을 능가한다. 기업과 조직은 더 나은 효율성.. 더보기