2024/09 2

데이터, 데이터 사이언티스트란?

데이터: 객관적 사실이면서 동시에 추론 · 예측 · 전망 · 추정을 위한 근거로 기능하는 매개체  ● 정형(structured) 데이터 고정된 틀이 있으며 연산이 가능 (ex. CSV, 엑셀, 스프레드시트, 관계형 데이터베이스 등)  ● 비정형(unstructured) 데이터 고정된 틀이 없으며 연산이 불가능 (ex. NoSQL, 영상, 음성, 텍스트 데이터 등)  ● 반정형(semi-structured) 데이터 고정된 틀을 가지고 있지만 연산이 불가능 (ex. HTML, JSON, XML 등)   ● 데이터의 단위 각 단위 간 1,024 (2^10) 차이가 나지만 10진수를 많이 사용하므로 10^3 단위로 끊어서 표현하기도 한다.Bit : 데이터 구성의 최소 단위, 0과 1 두가지 값을 나타낸다.1 B..

데이터 분석 히스토리 및 향후 목표

1, 데이터 분석트랙에 참여하게 된 히스토리 저는 고려대학교 정치외교학과 졸업생으로, 정치 현상을 분석하는 과정에서 데이터의 중요성을 실감하게 되어 데이터 분석에 관심을 가지게 되었습니다. 2024년 1월부터 주로 Coursera 플랫폼으로 다음의 강의들을 들으며 공부했습니다. 1. 통계, 수학 Introduction to Statistics(Stanford University) Mathematics for Machine Learning(Imperial College London) Introduction to Probability (Harvard, Stats 110, Joe Blitzstein, Youtube) Machine Learning (Stanford, CS229,Andrew Ng, Youtube..