제일 유명한 ChatGPT 말고도 openai 회사에는 쓸모있는 api 서비스가 많습니다. 오늘은 많은 인공지능 api 중 무엇이 어떤 기능을 하는지 알아보고 소개해보는 시간을 가져보겠습니다.
[목차]
- openai 인공지능 api 무료인가 유료인가?
- ChatGPT api
- Whisper api
- Dall-E api
1. openai 인공지능 api 무료인가 유료인가?
챗봇으로 유명한 GPT-3 API만 알고있었습니다. 하지만 다른 쓸모있는 API가 많았습니다. chatGPT를 통해 어느정도의 API기능은 파악되었습니다. chatGPT가 해주는 기능으로는 다음과 같습니다.
- 일정 물음에 대한 답변 : 단편적인 정보에 대해 명쾌하게 알려줍니다. 일부 잘못된 자료도 있지만 대부분 인공지능 알고리즘으로 거의 맞습니다.
- 자동 번역 : 구글 번역기보다 자연스러운 번역이나 작문이 있습니다. 일반 자연어처리가 기본적으로 제공되다보니 성능이 좋습니다.
이와 같은 기능은 api를 통해서 내 시스템에 적용하려면 일정 제공량 이상으로는 유료로 제공됩니다. 제공해주는 무료크레딧으로 시범적으로는 사용가능해서 테스트해볼 수 있습니다.
openai 사이트에 보면 1000토큰당 0.002달러라고 표시되어 있습니다. 1000토큰당 2.2원정도 한다고 보면됩니다. 1000토큰은 보통 시간과 질문의 길이,양에 따라 정해집니다.
사용시간 1분당 사용료가 청구된다는 것으로 알고 있으며 토큰이 사용되는 알고리즘은 openai만 알고 있습니다. 제 생각으로는 길지 않은 단어 1개 정도가 1토큰이라고 생각하면 되겠습니다. 1000개의 토큰은 약 700개의 질문 정도로 생각하면 됩니다. 1000개의 단어는 생각해보면 참 애매한 갯수입니다.
앞서 말한 모델은 일반적인 chatGPT 모델를 말한 것이었고 api 종류에는 InstructGPT가 있습니다. InstructGPT 모델은 사전 학습된 GPT-3 모델을 Fine-tuning해서 만들어졌고 일반 1개의 지시사항에 대해서 적절한 응답을 생성합니다.
GPT-3.5 특징 : 대규모 다양한 텍스트 데이터셋을 이용해 학습하며 대화 같은 연속적인 흐름에 최적화
InstructGPT : 1개의 문장, 질문 등 지시사항에 적절한 응답으로 최적화
InsturctGPT 는 4가지의 모델로 분류되어 있습니다. 가격은 각자 다릅니다. 제일 빠른 것은 Ada이고 제일 정보가 많고 강력한 것은 Davinci 입니다. Ada의 가격은 1000토큰당 0.0004달러입니다. 4.4원 정도 되겠네요. Davinci 모델은 1000토큰당 0.02달러로 상당히 비싼편입니다. 22원 정도합니다. 다음 기회에 한번 사용해보고 알려드리겠습니다.
2. ChatGPT api
현재 chatGPT에서 사용되고 있는 모델은 GPT 3.5 Turbo 모델입니다. GPT 2.0 에 이어서 GPT 3.5까지 계속 튜닝되었는데요. 특정 영역을 사용할 때 InstructGPT 모델이 사용됩니다. 일반적인 모델은 GPT만 사용해도 충분합니다.
InstructGPT 모델이 사용되는 경우는 음성명령을 인식해서 대화하는 가상비서, 상업적인 대화 즉 CS에 사용되는 커머스 대화시스템, 특정 직업(변호사, 의사, 제품) 등 전문적인 영역에서는 InstructGPT 모델이 일반적인 GPT보다는 좋습니다.
그냥 InstructGPT 모델 말고도 내가 직접 챗봇을 학습시키는 모델도 있습니다. 내가 원하는 데이터로 알고리즘만 openai의 api를 사용하는 것입니다. 모델을 Fine-tuning하는 것입니다.
훈련시키는 비용과 사용비용이 각각 다릅니다. 알고리즘은 openai의 알고리즘을 사용하되 데이터 훈련은 나만의 방식대로 한다면 자신이 원하는 방향으로 사용자모델링 되어서 나올 수 있습니다. 흥미롭네요.
또 Embedding models이 있습니다. 이 모델은 고급 검색, 정보를 정돈되게 모아주는 클러스터링, 토픽 분류 등 빅데이터 형식으로 정보를 모아 보여줍니다. 나중에 따로 다루겠습니다.
3. Whisper api
openai가 가지고 있는 무기는 또 있습니다. 바로 음성인식 인공지능 모델 Whisper입니다. 1분마다 0.0006달러를 받네요. whisper는 mp3, mp4, mpeg 등 음성파일을 텍스트로 번역해주고 설명해줍니다.
파이썬 라이브러리를 통해 간단하게 사용할 수 있습니다.
import openai
audio_file= open("/path/audio.mp3", "rb")
transcript = openai.Audio.transcribe("whisper101", audio_file)
모든 api는 openai 라이브러리에 있으며 현재로선 whisper는 파이썬에만 있습니다.
지원되는 언어는 한국어는 물론있고 98개의 언어가 지원됩니다.
WER이라고 단어 해석 에러 비율을 나타낸 표입니다. 에러가 제일 적은 언어는 스페인어고 한국어는 그래도 일본어만큼은 아니지만 14.3으로 상위권에 있으므로 상당히 정확한 편이라고 보면됩니다. 영어는 4.2, 일본어는 5.3을 기록하며 아주 상위권을 기록하고 있습니다. 인구 수 대비 꽤 인터넷에 훈련할 데이터가 많은 편이라고 보면 되겠습니다.
4. Dall-E api
요새 많이 보이고 있는 달리입니다. 챗봇으로 소설을 쓴 뒤 달리로 그림을 그려달라고 하면 거의 하나의 웹툰이 완성되죠. 달리의 가격도 만만치 않습니다. 하지만 성능은 놀랐습니다.
달리 api 가격
1024 x 1024 = 0.02달러 1장당
512 x 512 = 0.018달러 1장당
256 x 256 = 0.016달러 1장당
Dall-e의 주요 기능으로는 텍스트로 주어진 이미지를 생성하는 것입니다. GPT -3 모델로 학습되었다고 하며 텍스트와 이미지를 이어지는 학습을 주로 했습니다. 신기했던 것은 추상적인 그림까지 꽤나 그럴싸하게 그린다는 것입니다.
실제 존재하는 고양이의 사진처럼 아주 자연스럽습니다. 사진을 생성해내는 것 뿐만 아니라 텍스트를 이용해 특정 부분은 캡처하는 것, 크롭(잘라내기)하는 것까지 가능합니다. 명도와 채도 변경은 물론입니다.
이 api는 제가 좋아하는 node.js와 python 둘 다 사용가능합니다.
openai api를 사용하려면 계정등록 후 api key를 발급하신 후 호출해야합니다. 학술, 연구 용으로 사용한다면 api에 대해서 무료토큰을 받을 수 있습니다.
[함께 읽으면 좋은 글]
2023.03.14 - [IT 제품, IT지식] - openai 사용가능한 인공지능 api
2023.03.08 - [IT 제품, IT지식] - chatGPT 앱, 모바일 어플 같이 사용
2023.03.07 - [IT 제품, IT지식] - ChatGPT 한글 영어로 자동번역, 빠르게 응답받기
2023.03.05 - [IT 제품, IT지식] - 노션 AI 기능 더 효과적으로 활용하기
'IT 제품, IT지식' 카테고리의 다른 글
애플페이 사용법 - 가맹점 찾기, 유의사항, 단말기 (0) | 2023.03.25 |
---|---|
모니터암 어떤 것을 사는 것이 좋을까? 베사(VESA) 규격, 기준 (0) | 2023.03.18 |
맥북 휴대용모니터 고르는 기준, 추천 (1) | 2023.03.12 |
2023년 3월 맥북 4K 가성비 모니터 보는 기준, 추천 (0) | 2023.03.10 |
애플페이 앱 편하게 이용하는 기술, 앱클립(App Clip) (0) | 2023.03.09 |
댓글