분류 전체보기
![[밋업 후기] W&B 서울 밋업 #3](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2FbsXUxJ%2FbtsL0Z2B83t%2FkRlgjih09MxoyEZlzANNfK%2Fimg.png)
[밋업 후기] W&B 서울 밋업 #3
AI, 딥러닝 분야에서 학습 예제를 실행해봤다면 한 번 쯤 들어봤을 wandb에서 진행하는 세번째 밋업에 다녀왔습니다 ✨작년에 진행했던 두 번의 밋업은 참석하지 못했습니다 ㅠㅠ이벤트어스 사이트에서 신청했고, 이번에는 일찍 신청하면 추첨 없이 확정인 것 같았습니다! 0. W&B 소개 / W&B는 손쉽게 딥러닝 모델을 학습, 평가할 수 있는 툴을 제공한다. 일반 ML 모델에는 학습 로깅 및 시각화 기능인 Experiments, 하이퍼파라미터 최적화 기능인 Sweeps 등이 있다. LLM 모델에는 모델 입출력 추적 기능인 Traces, 평가 기능인 Evaluations가 있다.이러한 기능 뿐만 아니라, LLM을 빌딩하는 곳에서 wandb를 많이 사용하기 때문에 작년에는 LLM을 평가하는 호랑이 리더보드도 공..
![[AWS] AI Practitioner 시험 후기(AIF-C01)](https://img1.daumcdn.net/thumb/R750x0/?scode=mtistory2&fname=https%3A%2F%2Fblog.kakaocdn.net%2Fdn%2Fcr8MUh%2FbtsL194bPyz%2FUiU4rkudU15nqcFKwAquQk%2Fimg.png)
[AWS] AI Practitioner 시험 후기(AIF-C01)
AWS Certified AI Practitioner를 취득했다.클라우드 환경에서 AI 솔루션 만드는 일을 하는데 가장 적합한 자격증이라고 생각해 공부하기 시작했다. 물론 회사에서 지원해주는 시험 응시료도 한몫했다.개인적으로는 AWS 클라우드 서비스보다는 AI에 대해 더 잘 알고 있어야 취득하기 수월하다 생각한다. 1. 시험 정보1) 문항 수: 65문제 (15문제는 점수에 반영되지 않으며 시험 중에는 어떤 문제인지 알 수 없다.)2) 시험시간: 100분 (원래 90분인데 한국어로 신청해 시간을 더 받았다.)3) 소요시간: 50분4) 응시료: 100 USD (환율이 올라 13만 원 넘게 나왔다.)5) 시험장: 오프라인으로 응시했다. 신분증 검사, 서명하고 소지품을 모두 캐비넷에 넣은 후 시험장으로 이동했다..
[프로그래머스] 행렬 테두리 회전하기
문제 정사각형 혹은 직사각형 형태의 2차원 행렬이 주어지면, 회전 queries에 따라 테두리에 있는 숫자들만 시계 방향으로 1칸씩 회전한다. 각 회전마다 가장 작은 숫자를 구하여라. 아래 예시에서 회전을 3번 하는데 각 회전 당 가장 작은 숫자는 8, 10, 25이다. (문제 링크) 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 내 풀이 처음에 가장자리에 위치한 숫자들을 시계방향으로 이동시키다가, 모서리에 있는 숫자들을 계속 저장해야 한다는 점을 깨달았다. 숫자들을 하나씩 시계방향으로 이동하지 않고, 모서리에 있는 숫자가 안 겹치게 하기 위해 그림처럼 ..
SPPnet
입력 이미지 크기와 상관없이 CNN을 적용할 수 있도록 Spatial Pyramid Pooling 기법을 제안한 논문이다. 1. 배경 R-CNN 이전에 제안된 R-CNN은 convolution layer 이전에 crop이나 warp로 이미지 크기를 고정시킨 후 2000개의 영역에 CNN을 통과시켰다. 따라서 다음과 같은 단점을 가진다. 2000개의 region에 각각 CNN을 통과시킨다. → CNN 연산량이 너무 많아 속도가 느려진다. 강제 warping → 큰 객체는 줄이고, 작은 객체는 늘려 정보 손실로 인해 성능이 하락할 수 있다. CNN, SVM classifier, bounding box regressor를 따로 학습해야한다. end-to-end 모델이라고 볼 수 없다. SPPnet 입력 이미지..
R-CNN
R-CNN은 CNN을 object detection task에 처음 적용한 모델로 2-stage 모델에 해당하며, 초기 모델로 구조는 꽤나 직관적이다. 0. Overview selective search 알고리즘을 사용해 region proposal(이미지에서 객체에 대한 후보 영역 검출)을 수행한다. 뽑은 2천개의 이미지 영역(다양한 크기, 비율을 가짐)을 고정된 크기의 이미지로 resize 한다. (원본 이미지의 비율을 고려하지 않아 여기서 이미지 변형이나 손실 발생) 총 2천개의 영역에 pre-trained ConvNet에 통과시켜 4096차원의 특징 벡터(feature vector)를 추출한다. 추출한 feature vector에 각 클래스별로 학습시킨 SVM classifier를 사용해 분류 수..
NMS (Non Maximum Suppression)
1. NMS NMS란 하나의 객체(object)에 bbox가 여러개 만들어진 경우 각 객체당 confidence가 가장 큰 bbox 하나만 남기는 기법이다. 가장 정확한 bbox 하나만 남기는데, optimal bbox를 찾을 수는 없고, bbox 후보 중 가장 정확도가 높은 bbox를 찾는다. (local maxima를 찾는 과정) 2. NMS 과정 각 bbox는 해당 객체를 얼마나 잘 detect하는지를 나타내는 confidence 값을 가진다. 모든 bbox에 대하여 threshold 이하의 confidence값을 가지는 bbox는 제거한다. (threshold를 기준으로 1차적으로 필터링) confidence score를 기준으로 나머지 bbox를 내림차순 정렬한다. 첫번째 bbox를 기준으로 다..
성능 평가 지표 3(속도)
1. FPS (frames per second) fps는 frames per second의 약자로 초당 처리하는 프레임 개수를 의미한다. fps 값이 클수록 모델이 빠르다는 뜻이다. 2. FLOPs (FLoating Point OPerationS) 단위 시간(1초)에 얼마나 많은 소수점 연산을 수행하는지 측정하는 지표로, FLOPs 값이 작을수록 빠른 모델이다. ‘FLOPs가 큰게 빠른 모델이 아닌가?’ 라는 생각이 들 수 있지만, 모델이 단위 시간에 처리할 수 있는 capacity가 아니라 단위 시간에 처리해야하는 일의 양을 의미한다. 1초 동안 연산을 100번 해야하는 모델과 10번 해야하는 모델 중 후자가 더 빠르기 때문에 FLOPs가 작을수록 빠른 모델이다. (단위 시간동안 처리해야할 연산량, 파..
IoU (Intersection over Union)
object detection task에서 IoU가 필요한 이유 classification task의 경우에는 정답 라벨이 있기 때문에 예측값이 정답 라벨과 동일한지 비교하면 된다. 하지만, object detection의 경우 정답 bbox와 예측 bbox가 얼마나 겹치는지에 따라 맞은/틀린 bbox 예측인지가 달라지기 때문에 얼마나 겹친 bbox를 맞다고 판단할지에 대한 기준(TP, FP를 판단하는 기준)이 필요하다. 그래서 IOU가 뭐야? 한국말로 교집합 / 합집합 이라는 의미로, 두 bbox의 교집합을 합집합으로 나눈 값이다. 두 개의 bounding box의 좌표가 주어졌을 때 IoU를 시각화하면 위와 같다. 두 bbox가 일치할수록 1에 가까운 값이 나온다. ⇒ 모델이 예측한 bbox와 정답 ..
성능 평가 지표 2
저번 포스팅에 이어 성능 평가 지표로 활용되는 ROC curve와 PR curve 에 대해 정리해보았다. 1-1. ROC curve Receiver Operating Characteristic curve의 약자로, threshold에 따른 모델의 분류 성능을 나타낸 것이다. sensitivity(민감도), 특이도(specificity)로 그려지는 곡선이다. default threshold는 0.5로 [0.0, 0.49] 값을 가지는 probability는 False, [0.5, 1.0] 값을 가지는 probability는 True로 예측한다. threshold에 따라 에러율, False Positive와 False Negative 값이 변한다. True Positive Rate: recall, sensi..
성능 평가 지표 1
볼 때마다 나를 혼동시키는 혼동 행렬부터 precision, recall, f1 score까지 모델의 성능 평가 지표에 대해 정리해보았다. 1. Confusion Matrix 학습을 수행한(통한) 모델의 예측 성능을 측정하기 위해 모델의 예측값과 실제값을 비교하기 위한 표 분류 모델의 성능 평가 지표로 사용된다. 모델을 평가하는 요소는 모델이 예측한 값과 정답이 얼마나 유사한지, 예측과 정답간의 관계를 통해 정의할 수 있다. 시국에 맞게 코로나에 걸린 사람과 걸리지 않은 사람을 예측하는 모델을 예로 들어 코로나에 걸리면 Positive(양성), 걸리지 않으면 Negative(음성)로 표현한다. 이름은 (예측값이 맞았는지) (예측값) 순서로 읽으면 된다. True Positive(TP): 실제 Positi..