일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Java
- nodejs
- 도커
- docker
- Mac
- 딥러닝
- Oracle DB
- 머신러닝
- Spring Framework
- oracle
- 자바
- node.js
- sap mm
- SAP ERP
- db
- 비지니스영어
- ABAP
- 영어
- SAP ABAP
- 자바스크립트
- Programming
- 유럽여행
- Python
- 노드
- 파이썬
- JavaScript
- SAP
- IT
- 오라클 디비
- 오라클
- Today
- Total
목록크롤링 (2)
JIHYUN JEONG

데이터를 수집해서 라임 스쿠터/킥보드(lime scooter)의 데이터분석 프로젝트를 진행해보겠습니다. 라임에 대해서 간단하게 설명하자면 글로벌 전동킥보드 강자로서 2017년 미국 캘리포니아에 설립된 라임은 현재 스타트업 기업이지만 기업 가치가 1조원이 넘는 대표적인 ‘유니콘 기업’입니다. http://www.greenpostkorea.co.kr/news/articleView.html?idxno=109689 글로벌 전동킥보드 강자 '라임', 한국 상륙 [그린포스트코리아 이재형 기자] 올해 서울시내에서만 1만대까지 확대되는 국내 전동킥보드 공유서비스 시장에 새로운 강자가 나타났다. 누적 탑승 1억 회를 기록한 글로벌 마이크로모빌리티(소형 이동수단) 기업... www.greenpostkorea.co.kr 그..
머신러닝을 위한 데이터 처리에 기본인 크롤링, 스크레이핑에 대해서 알아보기로 한다. 데이터 스크레이핑으로 데이터를 수집하고 머신러닝을 수행하는 기법에 대해 간단히 알아보기 합니다. 1. 웹에서 데이터 다운로드 하기2. 데이터를 가공해서 저장하기3. 저장된 데이터를 활용해 머신러닝 수행하기 [정의] 1. 스크레이핑 - 웹 사이트에 있는 특정 정보를 추출하는 기술 - 대부분 HTTML 형식 - 웹에서 데이터 추출 하는 것 뿐만 아니라 구조도 분석 - 로그인해서 필요한 웹 페이지에 접근 하는 기술 필요 2. 크롤링 - 프로그램이 웹 사이트를 정기적으로 돌며 정보를 추출하는 기술 - 크롤링하는 프로그램을 크롤러 or 스파이더 라고 함 [머신러닝에 활용되는 대표적인 형식] 1. 쉼표로 구분하는 CSV 형식의 데이..