마이크로소프트 OpenAI, 인공지능

OpenAI와의 협력(ChatGPT, DALL·E, Codex, GitHub Copilot)

 

마이크로소프트는 2019년, 2021년, 다년간 수십억 달러를 OpenAI에 투자해 왔습니다. 이를 통해 OpenAI의 독립적인 연구를 계속하고 점점 더 안전하고 유용하며 강력한 AI를 개발할 수 있게 하고 있습니다.


OpenAI는 2023년 1월 23일, 마이크로소프트와 파트너쉽을 확장했다고 발표했습니다.

OpenAI는 모든 모델을 교육하는 데 사용하는 여러 슈퍼컴퓨팅 시스템을 Azure로 구축하기 위해 협력했습니다. Azure의 고유한 아키텍처 설계는 AI 교육 및 유추 워크로드에 동급 최고의 성능과 규모를 제공하는 데 매우 중요했습니다. 마이크로소프트는 독립적인 연구를 가속화하기 위해 이러한 시스템에 대한 투자를 늘릴 것이며 Azure는 연구, API 및 제품 전반에 걸쳐 모든 OpenAI 워크로드에 대한 독점 클라우드 공급자로 남을 것입니다.




ChatGPT


ChatGPT는 OpenAI가 개발한 언어 모델입니다. 딥 러닝 기술을 사용하여 사람이 작성한 것 같은 텍스트를 생성하는 AI입니다. 트랜스포머 아키텍처를 기반으로 하며 대규모 텍스트 데이터 코퍼스에 대해 교육을 받아 일관성 있고 주어진 프롬프트와 관련된 텍스트를 생성할 수 있습니다.


ChatGPT는 종종 질문에 대한 답변, 요약 생성, 언어 번역 등과 같은 자연어 처리(NLP) 작업에 사용됩니다. 대화형 AI 모델로 설계돼 인간의 대화를 모방하는 방식으로 텍스트 입력에 대한 응답을 생성할 수 있습니다.

이 모델은 GPT(Generative Pretrained Transformer) 아키텍처를 기반으로 하며 1,750억 개 이상의 매개 변수를 가진 사용 가능한 가장 큰 언어 모델 중 하나입니다. 이를 통해 인간이 작성한 텍스트와 구별하기 어려운 고품질 텍스트를 생성할 수 있습니다.

마이크로소프트에서는 ChatGPT를 다음과 같이 활용합니다.
  1. 고객 서비스: Microsoft는 ChatGPT를 사용하여 고객 서비스 챗봇을 강화하여 고객이 실시간으로 질문하고 유용한 답변을 받을 수 있습니다.
  2. 언어 번역: Microsoft의 번역 서비스는 ChatGPT를 사용하여 언어 번역의 품질과 정확성을 향상시킬 수 있습니다.
  3. 자동 텍스트 완성: Word 또는 Outlook과 같은 Microsoft Office 제품은 ChatGPT를 사용하여 사용자 유형에 따라 문장이나 단락의 완성을 제안하여 생산성을 향상시킬 수 있습니다.
  4. 대화형 AI: Microsoft는 ChatGPT를 사용하여 가상 비서, 챗봇 등과 같은 제품의 대화형 AI 경험을 강화할 수 있습니다.
  5. Codex: 자연어와 수십억 줄의 코드에 대해 교육을 받은 GPT-3 모델입니다. Python에서 가장 성능이 뛰어나며 C#, JavaScript, Go, Perl, PHP, Ruby, Swift, TypeScript, SQL 및 Shell을 포함한 12개 이상의 언어에 능숙합니다.

DALL·E


DALL·E는 OpenAI가 개발한 최첨단 생성 AI 모델입니다. "시계가 달린 세 발 달린 테이블"과 같은 텍스트 설명에서 고품질 이미지를 생성할 수 있습니다. 이 모델은 텍스트-이미지 쌍의 다양한 데이터 세트에 대해 훈련되어 새롭고 창의적인 이미지를 광범위하게 생성할 수 있었습니다.

DALL·E는 일러스트레이션, 제품 디자인, 애니메이션 제작 등 다양한 용도로 사용할 수 있습니다. 이 모델은 어린이 책에 대한 사용자 정의 일러스트레이션을 만들거나 특정 브랜드에 대한 제품 디자인을 생성하는 등 특정 작업이나 도메인에 맞게 미세 조정할 수 있습니다.

텍스트 설명에서 고품질 이미지를 생성함으로써 DALL·E는 설계 프로세스를 간소화하고 새로운 형태의 창의성을 가능하게 할 수 있는 잠재력을 가지고 있습니다.

마이크로소프트에서는 DALL·E를 다음과 같이 활용합니다.
  1. Office Suite: DALL·E를 PowerPoint 또는 Word와 같은 Microsoft Office 제품에 통합하여 사용자가 텍스트 설명을 기반으로 사용자 정의 일러스트레이션 및 그래픽을 생성할 수 있습니다.
  2. 설계 도구: Microsoft는 DALL·E를 사용하여 설계 개념의 미리 보기를 생성하거나 텍스트 입력을 기반으로 대체 설계를 제안하는 등 설계 도구의 기능을 개선할 수 있습니다.
  3. Virtual Assistant: DALL·E는 음성 또는 텍스트 요청에 응답하여 이미지를 생성하는 것과 같은 Microsoft의 가상 비서의 기능을 향상시키는 데 사용할 수 있습니다.
  4. 이미지 검색: DALL·E는 텍스트 설명을 기반으로 추가 결과를 생성하여 Microsoft의 이미지 검색 엔진의 결과를 개선하는 데 사용될 수 있습니다.

GitHub Copilot


GitHub Copilot은 최근 GitHub에 의해 소개된 AI 기반 코드 제안 도구입니다. 개발자가 코드를 작성할 때 머신 러닝 기술을 사용하여 실시간 코드 제안을 제공합니다. 이 도구는 GitHub 워크플로우에 통합되어 있어 개발자가 다른 도구나 환경으로 전환하지 않고도 작업할 때 제안을 받을 수 있습니다.

GitHub Copilot은 딥 러닝 모델을 사용하여 작성 중인 코드의 맥락을 이해하고 관련 코드 스니펫을 제안하여 코드를 작성하고 디버그하는 데 필요한 시간과 노력을 줄입니다. 이 도구는 매우 정확하도록 설계되어 일반적인 코딩 패턴 및 작업에 대한 관련 제안을 제공합니다.

GitHub Copilot은 개발자의 개발 경험을 개선하고 코드 개발 프로세스의 속도와 효율성을 높이기 위한 것입니다. 반복 작업을 자동화하고 코드 스니펫을 제안함으로써 GitHub Copilot은 개발 프로세스를 더 부드럽고 생산적으로 만들 수 있습니다.


새로운 빙(Bing)과 엣지(Edge)


빙(Bing)은 마이크로소프트의 검색엔진이고 엣지(Edge)는 브라우저입니다. 검색, 브라우징, 채팅을 웹 어디에서나 불러올 수 있는 하나의 통합된 경험으로 통합하여 제공합니다:

  1. 더 나은 검색: 새로운 Bing은 익숙한 검색 환경의 개선된 버전으로 스포츠 점수, 주가, 날씨와 같은 간단한 항목에 대해 더욱 관련성 높은 결과를 제공하며, 원하는 경우 보다 포괄적인 답변을 표시하는 새로운 사이드바를 제공합니다.
  2. 완전한 답변: Bing은 웹 전체의 결과를 검토하여 원하는 답을 찾고 요약합니다. 예를 들어, 여러 결과를 스크롤하지 않고도 지금 바로 베이킹 중인 케이크에서 달걀을 다른 재료로 대체하는 방법에 대한 자세한 지침을 얻을 수 있습니다.
  3. 새로운 채팅 경험: 자세한 여행 일정을 계획하거나 어떤 TV를 구매할지 검색하는 등 보다 복잡한 검색의 경우, 새로운 Bing은 새로운 대화형 채팅을 제공합니다. 채팅 환경에서는 더 자세한 정보, 명확성, 아이디어를 요청하여 원하는 완전한 답변을 얻을 때까지 검색을 구체화할 수 있으며, 결정에 즉시 실행할 수 있도록 링크가 제공됩니다.
  4. 창의적 자극: 답을 찾는 것 이상으로 영감이 필요할 때가 있습니다. 새로운 Bing은 사용자에게 도움이 되는 콘텐츠를 생성할 수 있습니다. 이메일을 작성하거나, 하와이로 떠나는 꿈의 휴가를 위한 5일간의 일정표를 작성하고, 여행 및 숙박 예약 링크가 포함된 일정을 만들거나, 면접을 준비하거나, 퀴즈의 밤을 위한 퀴즈를 만들 수 있습니다. 새로운 Bing은 또한 모든 소스를 인용하므로 참조하는 웹 콘텐츠의 링크를 볼 수 있습니다.
  5. 새로운 Microsoft Edge 환경: 새로운 AI 기능과 새로운 디자인으로 Edge 브라우저를 업데이트하고 두 가지 새로운 기능을 추가했습니다
    • 채팅 및 작성: Edge 사이드바를 사용하면 긴 재무 보고서의 요약을 요청하여 핵심 내용을 파악한 다음 채팅 기능을 사용하여 경쟁 회사의 재무와 비교를 요청하고 자동으로 표에 넣을 수 있습니다.
    • 또한 LinkedIn 게시물과 같은 콘텐츠를 작성할 때 시작하기 위한 몇 가지 프롬프트를 제공함으로써 Edge에 콘텐츠 작성을 도와달라고 요청할 수도 있습니다. 그런 다음 게시물의 어조, 형식 및 길이를 업데이트하는 데 도움을 요청할 수 있습니다. Edge는 사용자가 방문 중인 웹 페이지를 이해하고 그에 맞게 조정할 수 있습니다.