인공지능 4

GPT-4를 활용하여 여러 장의 이미지를 사용한 few-shot learning 하기

GPT-4 API를 활용한 이미지 분석 가이드소개GPT-4(GPT-4-turbo, GPT-4o) 모델은 인풋으로 텍스트 뿐 아니라 이미지도 사용 가능하다는 특징이 있습니다. 이 가이드는 GPT-4 API를 사용하여 이미지를 분석하고 원하는 정보를 추출하는 방법을 소개합니다. 새롭게 GPT API를 활용해보고자 하는 분들을 위해 작성되었으며, API 설정부터 간단한 이미지 분석 예시, 그리고 몇가지 input-output 쌍을 활용한 few-shot 프롬프팅까지 단계 별로 설명합니다.few-shot prompting 이란?AI 모델에게 작업을 수행하는 방법을 가르치는 효과적인 기술입니다. 모델에게 몇 가지 예시(보통 2-5개)를 제공하여 원하는 출력 형식이나 작업 수행 방식을 보여줍니다.1. 환경 설정먼저..

Deep Learning 2024.08.09

자연어 처리 왕초보 가이드

프로그래머스에서 진행한 KDT, 구글 머신러닝 부트캠프 과정에서 주로 vision 관련 AI 위주로 공부했는데, 입사 후 졸지에 자연어 처리를 빠른 시일 내에 마스터하라는(!!) 이야기를 들었다. 물론 강의 커리큘럼에 NLP 내용이 없었던 것은 아니지만, 프로젝트도 비전 관련해서 했기 때문에 '나 바쁜데 지금 필요없어' 라며 대충 대충 넘겼던 것이 화근이 되고 말았다. 진짜 처음부터 차근차근 공부하기 위해 정리한 리스트와 공부 과정 * 현재 공부하고 있는 것* https://wikidocs.net/book/2155 딥 러닝을 이용한 자연어 처리 입문 공부한 내용을 설명할 수 있을 정도로 정리하기 위해 기술 블로그가 아닌 책 형식으로 정리하고 있습니다. 잘 모르는 사람이 봐도 이해될 정도로 글을 쓰는 태도..

[W14D3] Visual Recognition, CNN 복습, 전이학습

Contents CNN기반의 Visual Recognition 1. 딥러닝 기반의 영상 인식 2. Convolutional Neural Network 3. 전이학습 Visual Recognition의 정의 : 카메라를 통해 취득되는 사진이나 동영상에서 정보를 취득하는 과정 딥러닝리뷰 딥러닝은 deep neural network을 통해 학습(learning)하는 것 층(레이어, layer)의 갯수가 3개 이하이면 얕은층 신경망, 4개 이상이면 심층 신경망 비선형 함수의 필요성 NN은 1개의 벡터(텐서)를 다른 벡터로 매핑하는 함수라고 볼 수 있다. 위의 NN은 X를 $a^{(3)}$으로 매핑하는 함수 만약 $W^{(1)}$와 $W^{(2)}$의 사이에 어떤 비선형적인 함수가 없다면, $W^{(2)}W^{(..

카테고리 없음 2021.08.05

CS231n : 스탠포드 딥러닝 강의 관련 자료

https://www.youtube.com/watch?v=vT1JzLTH4G4&list=PL3FW7Lu3i5JvHM8ljYj-zLfQRF3EO8sYv 프로그래머스 딥러닝 강좌를 열심히 듣고 있는 중이지만, 어렵다. 제공되는 강의를 한 번 듣고, 복습으로 한 번 더 듣고, 참고자료로 추천한 책도 들춰보지만, 여전히 수많은 정보들을 내가 이해를 하고 있는 것인지, 내 머리에 저장은 되는 것인지 정신이 없다. 수업시간 참고자료 중에 책 뿐 아니라, 강의 동영상 자료도 있길래 좀 찾아봤더니 유튜브에 무료로 공개되어있다고 해서 보기 시작했다. 구글링을 좀 해봤더니, 머신러닝, 딥러닝을 공부하는 초보자들에게 바이블 같은 강의같다. 그리고 프로그래머스 딥러닝 / 비전 쪽 강의의 커리큘럼도 이 강의의 얼개와 큰 차이가..

Deep Learning 2021.06.18