분류 전체보기(327)
-
2024 상반기 디지털 하나은행 합격후기
하나은행 전형은 서류 → 코테 → 1차면접(역량 위주 면접) → 2차면접(인성면접) 순으로 진행된다. 서류전형서류 전형에 대해서는 기준점을 명확하게 알 수는 없었지만 면접 스터디를 진행하면서 주위 사람들을 보니 대개 디지털 직군임에도 영어성적이 다들 월등히 좋았다......필자는 오픽 IH 하나였는데 꼴지였음.... 다들 AL 아니면 토익 900점대.....다들 혹시 모르니 영어성적 미리 준비해두면 좋을 것 같습니다(확실하진 않지만 적어도 오픽 IH는 따는걸로) 코딩테스트안내에 나와있듯 Python,Java,C 등 다양한 언어로 푸는 코딩테스트 문제 3문제 + SQL 2문제로 총 5문제 나옵니다.개인적으로는 다른 기업과 크게 다르지 않은 난이도였고 유독 어렵진 않았다.SQL이 시간 좀 잡아먹어서 마지막에..
2024.06.02 -
DL 기본 상식 2
Gradient Descent에 대해서 쉽게 설명한다면? 기울기. 즉 loss function에서 cost를 최소로 하는 모수(파라미터)를 찾기 위한 과정이다. Gradient Descent에서 가로축과 세로축은 무엇인가? 가로축은 찾고자 하는 모수(=파라미터)이며 세로축은 cost. 즉 loss입니다. 실제 상황에서는 gradient가 0인 지점을 찾기위해 반복되며 양수일 때는 모수 값을 감소시키고, 음수일 때는 모수를 증가시키기 때문에 0을 기준으로 진동하는 그래프가 형성됩니다.(x축은 파라미터, y축은 gradient) Gradient Descent에서 Loss가 증가하는 이유는? 극솟값 주변에서 learning rate가 너무 커서 진행을 너무 많이 했을 때 입니다. 한편으로는 local mini..
2024.04.22 -
DL 기본 상식
볼츠만 머신은 무엇인가요? 가시층과 은닉층, 총 두 개의 층으로 구성된 신경망입니다. Full-connected 형태이며 확률모델로 분류나 선형 회귀 분석등에 사용될 수 있습니다. 딥러닝은 무엇인가요? 딥러닝과 머신러닝의 차이는? 딥러닝은 머신러닝이 고도화로 발전된 것으로 사람의 도움 없이 정확한 결정을 내릴 수 있도록 프로그래밍한 신경망을 의미합니다. 머신러닝과 차이점이라고 한다면 인간의 도움여부라고 이해하고 있습니다. 머신러닝은 여러 feature 중 어떤 feature를 추출할지 사람이 직접 분석하고 판단하는 반면 딥러닝은 모델이 스스로 데이터로부터 특징을 추출하여 학습합니다. 하이퍼 파라미터란? 파라미터와 차이점 일단 파라미터란 매개변수로 weight라고도 표현합니다. 데이터를 통해 결정되는 모델..
2024.04.22 -
ML 기본 상식 3
LSA, LDA, SVD 란? - LSA (Latent Semantic Analysis) : SVD를 단어-문서 행렬에 사용하여 LSA(잠재 의미 분석)을 수행. - LDA(Latent Dirichlet Allocation) : 문서에 어떤 주제들이 존재하는지에 대한 확률 모형 **정리 : LSA,LDA 모두 토픽 모델링에 활용되는 기법이다. - LSA : DTM을 truncated SVD를 통해 축소하여 축소 차원에서 근접 단어들을 토픽으로 묶는다. - LDA : 단어가 특정 토픽에 존재할 확률과 문서에 특정 토픽이 존재할 확률을 결합확률로 추정하여 토픽을 추출한다 SVM(Support Vector Machine)이란? - 마진 최대화. 즉 support vector를 통해 margin이 최대가 되는 ..
2024.04.22 -
ML 기본 상식 2
Feature Vector란? - 정형 데이터에서 row. 즉 데이터가 가지는 feature를 vector형태로 담은 것. 좋은 모델이란? - 데이터에 알맞는 모델 크기로 추론시간이 빠르면서 정확도가 높은 모델이 좋은 모델입니다. 같은 성능이라면 모델의 크기가 작은 단순한 모델이 더 좋은 모델이라고 볼수도 있습니다. Metric의 종류와 설명 - Regression 문제 : MSE, MAE가 대표적 - Classification 문제 : Accuracy, Recall, Precision, F1 score가 대표적 Accuracy, Recall, Precision, F1 score - Accuracy(정확도) : 전체 정답 중 모델이 맞춘 비율 - Recall(재현율) : 실제 True인 것 중에서 모델이..
2024.04.21 -
2. Tries 알고리즘
Trie 알고리즘 - 빠른 문자열 검색 자료구조 - Tree 형태로 각 단어를 저장. words = ["frodo", "front", "frost", "frozen", "frame", "kakao"] head, head_rev = {},{} lengths = [] def tries(head, word): node = head # 포인터 지정 for w in word: if w not in node: node[w]={} node = node[w] # 포인터 이동 if 'len' not in node: node['len'] = [len(word)] else: node['len'].append(len(word)) node['end']=True # 각 단어의 끝을 표시 for word in words: trie..
2024.04.19