[자격증] 머신러닝-딥러닝 (for AICE Associate) 머신러닝과 딥러닝 모델을 학습하고 결과를 확인하는전반적인 과정에 대한 코드 맛보기 ! 데이터 준비 @ 필요한 라이브러리 임포트import numpy as npimport pandas as pdimport matplotlib.pyplot as plt@ cvs 데이터 읽어오기 : pandas의 read_csv로 읽어오면 dataframe 형식의 파일로 생성된다. df = pd.read_csv('data_v1_save.csv')@ 라벨 인코딩 : 특정 시리즈(컬럼)의 범주형 데이터에 0부터의 정수를 할당하여 변환 / fit-정수할당, transform-변환from sklearn.preprocessing import LabelEncoderle = LabelEncoder()le.fit(df['gender'])d.. [자격증] 데이터 전처리 (for AICE Associate) AI에게 있어 데이터 전처리의 중요성은 말할 필요가 없을 정도로 중요하다. 데이터에 대한 이해를 통해 올바른 결과를 얻을 수 있다. 출제 범위 및 합격 기준문제 수 : 14문항 / 90분합격 점수 : 80점 이상시험 준비 요령: 제한 오픈북!!!(구글 검색 가능) : 본인이 정리한 글이 아닌 구글 검색으로 나오는 모든 자료 가능! (GPT 같은건 당연히 안됨)(오픈북인지 몰라서 혼자 암기로 했는데 라벨인코딩 코드 기억안나서 시험 개망한 블로그 주인장의 눈물 ....)문제지의 변수또는 컬럼 이름을 복사/붙혀넣기가 불가능데이터를 계속해서 변환해가며 갱신해 사용하기에 중간 과정에서 문제가 생길시 후반 작업 불가능데이터 가공 부터 머신러닝, 딥러닝 까지 이어지는 전반적인 과정을 이해할 필요가 있음각각의 기능을 .. [Utils] 정규 표현식과 Re 복잡한 문자열을 처리하기 위해 사용하는 기법인 정규 표현식! 문자열 매칭을 위한 여러 메타 문자들을 배워보자 메타 문자: 원래의 뜻이 아닌 특별한 의미를 가진 정규 표현식의 문자 . ^ $ * + ? { } [ ] \ | ( )문자 클래스 [ ]: 괄호 사이의 문자들과 매치[abc] = [a-c] : a, b, c 중 한개의 문자와 매치를 확인[012345] = [0-5] : 0부터 5까지의 숫자가 포함되었는지 확인[^0-9] : ^는 not의 의미 / 숫자가 아닌 문자만 매칭.(dot) 문자 : \n(줄바꿈 문자) 을 제외한 모든 문자와 매치a.b : a와 b라는 문자 사이에 어떤 문자가 들어가도 모두 매치 a[.]b : 여기서 .(dot)은 메타문자가 아닌 "." 문자 그대로를 의미* 문자: 반복을.. [Data] pandas 핵심 기능 정리 numpy에서 2차원 행렬 기능을 발전시킨 파이썬 라이브러리AI 시대 데이터 전처리를 위한 필수품! 정의 구조화된 데이터의 조작과 분석을 위한 데이터 프레임 및 시리즈 객체를 제공하는 파이썬 라이브러리 목적 머신러닝 학습이나 각종 시각화 전에, 2차원 데이터를 원하는 형태로 구조화 하고 전처리 하기 위해 특징특징들내용데이터 조작 및 변환 데이터 선택, 필터링, 정렬, 집계 및 피벗 / 결측치 처리, 중복 제거, 데이터 형 변환 빠른 연산 속도NumPy의 연산 엔진 기반 / 벡터화(Vectorization) 지원다양한 데이터 소스 지원CSV, 엑셀, SQL 데이터베이스, JSON데이터 시각화 연동시각화 라이브러리 Matplotlib, Seaborn * 피벗 : 행과 열의 기준값을 변경하여 데이터프레임의.. [Utils] github 기본 사용법 정리(feat.TIL) 개발자의 필수 스킬 ! GIT 사용하는 방법https://github.com/100-hours-a-week/2-kb-heabo.git GitHub - 100-hours-a-week/2-kb-heabo: heabo's TILheabo's TIL. Contribute to 100-hours-a-week/2-kb-heabo development by creating an account on GitHub.github.com * git clone 와 같이 표시한 것은 안에 값을 넣는 것이 아닌 전체를 내 정보로 바꾸라는 뜻0. 깃 설치하고 최초 설정 : git config -> 깃 허브에 등록된 계정 이름(user.name)과 이메일(user.email)을 등록-> git.name과 git.email이 제대로 .. [Data] numpy 핵심 기능 정리 다차원의 행렬의 연산에 최고의 선택pandas의 기반 데이터 구조 Numpy(Numerical Python)https://numpy.org/ NumPyUse the interactive shell to try NumPy in the browsernumpy.org정의 과학 및 수학 데이터 분석에서 다차원 행렬을 다루고 연산하기 위한 파이썬 라이브러리 목적 파이썬에서 리스트나 튜플의 데이터를 넘파이 배열로 바꾸어 좀 더 효율적이고 쉽게 행렬연산을 할수있도록 함 특징 1. 데이터 타입> ndarray(리스트와 유사)# 여러개의 축(axis, 차원)을 다룰 수 있음 2. View and Copy> View : 얕은 복사, 임시저장, 상호 연결# in numpy: the internal data buffer .. [DL] 딥러닝 기초개념 정리 딥러닝을 위한 가장 기본적인 코드들1. tips2.csv 데이터 가공 및 불러오기import seaborn as snsfrom sklearn.preprocessing import LabelEncodertips = sns.load_dataset('tips')tips.sex.replace(['Female', 'Male'], [0,1], inplace=True) # 성별 남/여-> 1, 0tips.smoker.replace(['No', 'Yes'], [0,1], inplace=True) # 흡연 유/무 -> 1, 0tips.time.replace(['Dinner', 'Lunch'], [1,0], inplace=True) # 점심/저녁 -> 1, 0le = LabelEncoder()tips.day = le.fi.. [ML] 마스터 알고리즘(책) -페드로 도밍고스 머신러닝을 공부하기 위해 "파이썬 머신러닝 완벽가이드"라는 도서를 구매했다. 이 교제의 시작부분에서 이 "마스터 알고리즘"이라는 책을 소개하였다.나는 머신러닝의 입문자로서 앞으로의 학습 방향을 설정하기에이 책은 좋은 선택이 될것이라 생각이 들어 읽게 되었다. 가장 흥미로웠던 점은 지금까지 스쳐가며 들었던 각종 알고리즘들이 시작된 학파가 있고, 지금까지 각자의 논리와 영역에서 발전해왔다는 것이었다. 수많은 알고리즘들이 5개로 분류할 수 있다니 ! 심지어는 모든 상황에 적용가능한 마스터 알고리즘을 만들어야 한다니 ! 처음보는 용어가 많았지만 차근차근 읽다보면 이해가 될수 있도록수식이나 용어는 최소화하고 예시와 쉬운 설명으로 채워진 좋은 입문서였다. 그렇기에 AI 전문가를 꿈꾸는 또다른 누구에게도 이 책을 강.. [자료구조] 최단거리 알고리즘 문제 정리 최단거리를 구하는 다양한 방법들===알고리즘 한눈에 보기===알고리즘사용목적자료구조탐색방식BFS(너비 우선탐색)가중치x, 양수가중치(음수x)Queue (FIFO)가중치 동일한 그래프 탐색-> Unweighted Graph다익스트라 알고리즘가중치o, 양수가중치(음수x)우선순위 큐 (Min-Heap)그리디 탐색 (BFS 확장형)-> 방문할 정점을 우선순위 큐로 관리하여 최적화벨만-포드 알고리즘가중치o, 양수/음수 가중치배열 (Edge List)완전 탐색 (모든 간선 반복)-> 모든 간선을 V-1번 반복하여 거리 갱신플로이드-워셜 알고리즘모든 쌍 최단거리,양수/음수 가중치2차원 배열 (DP 테이블)DP(동적 프로그래밍) 기반 점진적 갱신-> 모든 쌍의 최단거리 탐색-> 점화식으로 거리 갱신A*(A-star) .. [ML] 머신러닝 기초개념 정리 머신러닝 기본 개념 스쳐가며 보기 (지도학습)## 모델학습이란- 목표: 최적 직선 구하기 -> 직선별 손실함수 구하기 -> 손실함수 최소값 구하기## 머신러닝 프로세스- 데이터 수집 -> 데이터 정리 -> 모델학습 -> 모델 테스트 -> 모델 배포## Linear Regression(선형회귀) 이란?- 직선을 그어 데이터 경향을 나타내는 것! ## 가장 잘 맞는 직선이란? - y = wx + b- 최적의 w, b알기 -> cost fucntino 계산## Cost Function - MSE(Mean Squared Error : (실제 - 예측)**2 / N : 실제값과 예측값의 차이의 변환 값- Error가 적을수록 좋은 모델## Cost Function 최적화- Cost Function은 x^2 포물선.. [문제리뷰] 수식 최대화 -python (programmers,Lv2) https://school.programmers.co.kr/learn/courses/30/lessons/67257 프로그래머스SW개발자를 위한 평가, 교육, 채용까지 Total Solution을 제공하는 개발자 성장을 위한 베이스캠프programmers.co.kr## [카카오인턴] 수식 최대화 문제 # target- input : expression(숫자와 연산자이 섞어 있는 일차 계산식을 담은 문자열)- output:연산자의 우선순위에 따른 계산 결과의 값 중 최대값을 도출ex) * > + > - 의 순서로 순위가 높은 연산자부터 계산# 필요한 함수(정의)- solution : 여러 함수의 결과를 받아 최종 답을 산출- expr_split : 계산식을 숫자와 연산자로 나누어 리스트에 문자로 저장하여 리.. [차] Garden tea -blended Ceylon tea 부드러운 장미 꽃향을 느끼고 싶은 날, 저녁에 마시는 차Evening tea accentuated by a smooth floral sweetness[기본 정보]- 이름 : Garden Tea(정원 티)- 잎 원색 : Ceylon(black), rose(light red) - 차의 색 : red(빨강)- 구매처 : Singapore Botanic garden(싱가포르 보타닉가든) - 제조사: The 1872 Clipper Tea Co.- 원산지 : Sri Lanks(스리랑카)- 보관 가능 기간 : 2년 이상- 먹는 법: 96°C-98°C for 2~3min - 카페인 : 포함됨 [세부 구성] - 2g per a tea bag / 24 tea bags in a package- Pure Ceylon Bla.. [자료구조] 이진 탐색 트리(BST) 기본 개념 -python 데이터를 다룬다면 반드시 이해해야 하는 이진탐색트리 ! 1. 트리(Tree) 기본 개념 : 계층 구조를 표현하는 용도. ex) 데이터 베이스, 인공지능 의사 결정 트리2. 구성요소: -> 루트 노드(root node, 가장위의 값), 노드(node, 트리 구성 각 요소), 간선(Edge, 노드를 연결하는 선)3. 노드간 관계:-> 부모 노드(parent, 위에 있는)-자식 노드(child, 아래있는)-> 형제 노드(Sibling, 같은 부모), 리프 노드(Leaf, 자식 없는) 2. 이진 트리(Binary Tree) : 노드 하나가 최대 2개의 자식 노드를 가짐-> 루트 노드 : 배열 인덱스 1번-> 왼쪽 자식 : 배열 인덱스 = 부모 노드 * 2 (+ 1)* -> 오른 쪽 자식: 배열 인덱스 = 부.. [작문]행복은 돈으로 살 수 있다. 행복을 사고 팔수 있게 된 세상 속에서사람들은 모두 행복해졌을까? [1부] 행복은 돈으로 가치를 매길 수 없어 2029년 10월 23일경기도 수원시 한 대학가 작은 원룸에 살고 있는 27세 강호. 아침에 일어나 유튜브를 보고 있다. 유튜브에서 한 광고가 틀어져있다. "여러분이 부자가 될 수 있는 최고의 기회! 여러분의 행복을 남들에게 판매하세요. 12월 1일까지 무료 시술을 통해 여러분은 최고의 행복 상인이 될수 있습니다!늦지말고 홈페이지에서 신청 .... " "요즘 사기꾼 놈들이 왜이렇게 많아..."강호는 콧웃음을 치며 광고를 스킵하고무거운 몸을 일으켜 밖으로 나섰다. ... 강호는 대학 병원에서 창고에서 물건을 나르는 아르바이트를 하고있다. 먼저 와 박스들을 정리하고 있는데 같이 일하는 용희가.. [논문] 2024 노벨화학상 - AI model predicting protein structures Life could not exist without proteins. That we can now predict protein structures and design our own proteins confers the greatest beneft to humankind.단백질 없이는 생명이 존재할 수 없습니다. 이제 우리가 단백질 구조를 예측하고 우리만의 단백질을 설계할 수 있다는 것은 인류에게 가장 큰 혜택을 줄수 있을 것입니다. ------------------------------------------------------------------------------------------------------------“One of the discoveries being recognised this.. [차] Cinnamon Oolong Tea -blended Oolong tea 자기전에 따뜻하게 한잔 하기 부담없고,동양 차의 은은한 잎 향을 좋아하는 사람들에게 추천 [기본 정보]- 이름 : 시나몬 우롱차(Cinnamon Oolong Tea)- 잎 원색 : 짙은 갈색(dark brown)- 차의 색: 옅은 노랑(light yellow)- 구매처 : 베트남(vietnam) - 유래: 중국(china)- 보관 가능 기간 : 6개월 이상 [세부 구성]- Hoa Long(화롱) 66% : 우롱 차나 잎차의 베이스- Que(계피) 35% : 강한 계피의 향과 맛을 추가- Hoa Hoa(화화) 10% : 차에 섬세한 꽃향기나 허브의 향을 더함 은은한 꽃향이 난다. 허브 보다는 진달래가 생각나는 그런 향이다. 자세히 느끼면 가벼운 풀 향이 난다. 맛은 모르고 먹으면 계피라는 생각이 나지 .. 이전 1 2 다음 목록 더보기