빅데이터 관련 용어를 쉽게

하둡 / 머신러닝  / 딥러닝 / R, Spark / 어플라이언스

하둡 Hadoop : 큰데이터를 저장할 수 있다.  분석 용도라기 보다 저장용도에 가까움 쉽게 말해 개인 pc에 엑셀이 설치된 상태라고 보면됨. 엑셀이 분석데이터가 아니라 이용자의 활용도에 따라 분석되듯이  하둡은 빅데이터를 저장하기 위한 장치라고 보면 됨. 보통 여러개의 값싼 pc를 상호연결해서 마치 하나인 컴퓨터 처럼 처리하게 하는 기술

머신러닝  : 사람이 학습 하듯이 컴퓨터(기계)에게도 학습할 수 있게 하는 기술 (예 : 과거에는 고양이 사진 만장을 줄테니 다 외우고  모자씌운 고양이를 판별하게 해서 스스로 학습했는지 확인함 .  최근에는 100장 정도만 부여해도 학습이 됨)

딥러닝 : 사람이 판단의 기준을 정해주지 않아도 컴퓨터 스스로가 판단하여 추론/인지/판단 할 수있는 기술 (예 : 알파고)

R : 오픈소스 빅데이터 분석도구 패키지

Spark : 

 

(오늘 금융연수원에서 빅데이터 활용전략 수립 수강중)


'공부' 카테고리의 다른 글

5G 가 대체 뭐지?  (2) 2018.01.07

공부 다른 글