'Data Science' 카테고리의 글 목록 (3 Page)

Notice

다시 블로그 시작

Recent Posts

Recent Comments

Link

« 2025/11 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

Tags more

Archives

Today

Total

관리 메뉴

목록Data Science (23)

JIHYUN JEONG

[판다스/Pandas] 람다(lambda) 함수를 사용하여 여러 컬럼 합(sum) 계산하기

여러 컬럼 합(sum)을 계산하여 하나의 새로운 컬럼에 넣어보는 것을 람다 함수를 사용하여 쉽게 해보겠습니다. 코드는 아래와 같습니다. import pandas as pd data = {'contestants': ('Alex', 'John', 'Sam', 'Alex', 'John', 'Sam', 'Alex', 'John', 'Sam'), 'round': (1, 1, 1, 2, 2, 2, 3, 3, 3), 'score1': (84.5, 91.4, 92.2, 85.2, 88.1, 83.1, 80.2, 93.5, 82.1), 'score2': (88.2, 89.8, 88.7, 86.3, 89.0, 83.1, 79.9, 92.8, 80.9), 'score3': (84.1, 90.2, 93.2, 89.0, 90...

Data Science/Data Analysis 2020. 3. 18. 00:16

[판다스/Pandas] 리스트(list) 내에 있는 딕셔너리(dictionary) 중복 제거

파이썬으로 리스트 내에 있는 딕셔너리(dictionary)의 특정 부분 값의 중복을 제거 해 보겠다. Spotyfi 데이터를 불러 오던 중 top_tracks의 중복이 발생하는 것을 발견 했다. 아래 보면 특정 id가 여러번 반복 되는 것을 볼 수 있다. 그래서 해결 한 방법은 아래와 같다. import json without_dup_tracks = {json.dumps(d, sort_keys=True) for d in top_tracks} without_dup_tracks = [json.loads(t) for t in set_of_jsons] 중복된게 해결 되었다.

Data Science/Data Analysis 2020. 3. 17. 22:06

[Spotify Data Analysis/스포티파이 데이터 분석] 파이썬 AWS Dynamo DB 연결 + boto3 (3)

파이썬 boto3 패키지를 활용하여 AWS DynamoDB에 연결해보겠습니다. 1. 우선 AWS에 로그인 후 DynamoDB를 생성합니다. 2. 테이블 이름은 원하는 이름을 주고 기본 키(Primary)를 무엇으로 할지 정합니다. 생성시 프리티어로 설정합니다. (과금방지) 3. 생성이 완료 되었으면 아래와 같이 테이블이 생성됩니다. 4. 이제 boto3 모듈을 아래의 명령어로 설치합니다. 사용 방법은 아래 공식 Document를 참고 합니다. - pip3 install boto3 https://boto3.amazonaws.com/v1/documentation/api/latest/index.html Boto 3 Documentation — Boto 3 Docs 1.12.22 documentation bot..

Data Science/Data Analysis 2020. 3. 17. 11:55

[Spotify Data Analysis/스포티파이 데이터 분석] MySQL DB Insert 한 데이터 select 조회하기 (2)

2019년도 Spotify 에서 가장 많이 스트림된 곡들을 아래 데이터 셋에서 가져온 후 https://www.kaggle.com/prasertk/spotify-global-2019-moststreamed-tracks Spotify global 2019 most-streamed tracks top 1,717 tracks with audio features and artist info www.kaggle.com 판다스에서 가수들만 추려서 csv로 만든 뒤 Mysql DB Insert 한 뒤 쿼리 예시이다. 총 488명의 가수 데이터를 가지고 Spotify API를 사용해서 artist 정보와 arist genres 정보를 Insert 한 결과를 select 해보았다. mysql> select count(*..

Data Science 2020. 3. 13. 17:13

[Spotify Data Analysis/스포티파이 데이터 분석] MySQL DB 생성후 연결 하기(1)

DSpotify Data Analysis/스포티파이 음원 데이터 분석을 위해 먼저 데이터 저장을 할 수 있는 DB를 생성해보겠습니다. 1. Amazon RDS(MySQL DB)를 생성합니다. 로그인 후 > RDS 클릭 > 데이터베이스 생성 2. MySQL을 선택하고 > 프리 티어 > 원하는 아래의 정보를 넣어줍니다. - DB 인스턴스 식별자: 임의로 - 마스터 사용자 이름: 터미널을 이용해서 연결하기 때문에 잊어버리지 않도록 정합니다. - 마스터 암호: 꼭 기억해둡시다. 3. 데이터베이스 생성 클릭 > 아래에 보이는 듯이 데이터 베이스가 생겼습니다. 클릭해서 들어갑니다. 4. 보안 > VPC 보안 그룹 선택 > 5. Edit inbound rules 선택 6. Add rule > Source: Anywe..

Data Science 2020. 3. 13. 10:15

SAS 파일 형식 엑셀(xls, xlsx)로 변환

1. 우선 먼저 옮길려고 하는 파일을 업로드 합니다. 2. 파일이 업로드 완료 되면 폴더를 임의로 하나 만듭니다. 제 경우에는 Untitled-Folder로 만들었습니다. 거기에 옮기고 싶은 파일을 넣습니다. 3. 라이브러리 > 오른쪽 마우스 클릭 > 새로운 라이브러리 > 해당 폴더 클릭 > 경로 지정 > 이름에 원하는 이름을 입력 합니다. 4. 그러면 아래와 같이 파일을 변환하고자 하는 파일이 보입니다. 5. 작업 및 유틸리티 > 유틸리티 > SAS 프로 그램 을 선택합니다. 6. 해당 코드에 아래와 같이 입력합니다. 그리고 맨 왼쪽 사람이 뛰는 듯한 아이콘을 클릭 7. 실행결과 로그에 오류가 아래와 같이 안나오면 정상적으로 파알이 엑셀형식으로 변환이 되었습니다. 8. 오른쪽 마우스 클릭 > 파일 다운..

Data Science/SAS 2020. 2. 5. 17:13

이전 Prev 1 2 3 4 Next 다음

목록Data Science (23)

JIHYUN JEONG

티스토리툴바