목록데이터분석 (27)
삶의 공유
안녕하세요 오늘은 Python의 Seaborn 라이브러리를 활용해서 데이터시각화를 한번 해보고자 합니다. Seaborn라이브러리는 matplot 보다 더 나은 기능을 제공합니다. 관련해서 seaborn 라이브러리 문서를 보고싶으시다면 하기 링크를 클릭 해주시면 됩니다. https://seaborn.pydata.org/examples/index.html Example gallery — seaborn 0.11.2 documentation seaborn.pydata.org 자 이제 예제로 들어가보겠습니다. 먼저 seaborn 라이브러리를 포함하여 데이터 시각화를 위해 필요한 여러 라이브러리를 호출해보겠습니다. import pandas as pd import numpy as np import matplotlib..
오늘은 파이썬 텍스트 마이닝을 하기 위한 준비 과정인 "네이버 API 이용 신청" 하기 포스팅 입니다. 1) 아래에 있는 url에 들어갑니다. ※url: https://developers.naver.com/products/service-api/datalab/datalab.md 2) 서비스 API > 데이터 랩에 들어갑니다. 3) 스크롤을 좀 내리다 보면 오픈 API 이용 신청 버튼이 있는데 이것을 클릭합니다. 4) 네이버 로그인을 합니다. 만약 네이버 로그인이 기존에 되어있으면 별도로 이런 과정이 생략됩니다. 5) 이용 약관에 동의 후 다음 스텝으로 넘어갑니다. 6) 휴대폰 인증까지 하면 하기 화면으로 넘어갑니다. 다음 화면에서 사용하고 싶은 API를 선택합니다. 7) 여기서 환경 추가가 중요한데 안드로..
Pandas Basics 파이썬에서 데이터 분석을 하기 위한 중요한 라이브러리 이고, 파이썬에서의 엑셀 이라고 볼수 있다. 데이터 프레임은 데이터를 행과 열을 이용하여 데이터를 다루는 영역이다. 시리즈는 데이터 프레임의 하나의 열, 배열이라고 볼수 있다 처음은 이게 무슨말인지 이해가 안될 수 있다. 하나씩 차근 차근 알아가보자 먼저 판다스 라이브러리를 호출 해보자. 다음과 같이 코드를 작성하면 된다. import pandas as pd 먼저 2개의 리스트를 만들어보자 my_list = ['AAPL', 'AMZN', 'T'] label = ['stock#1','stock#2','stock#3'] [Series] 시리즈는 판다스의 일차원 배열이라고 보면 된다. 이 시리즈는 데이터와 별명을 기반으로 이루어진다..
텍스트 마이닝 과정 중 하나인 데이터 수집 사이트에 대한 정보에 대해서 공유해보고자 이 포스팅을 작성해본다. [미국] 1. Kaggle : 데이터 과학 competition으로 유명한 kaggle의 데이터 저장소 https://www.kaggle.com/datasets Find Open Datasets and Machine Learning Projects | Kaggle Download Open Datasets on 1000s of Projects + Share Projects on One Platform. Explore Popular Topics Like Government, Sports, Medicine, Fintech, Food, More. Flexible Data Ingestion. www.kag..
주가데이터와 섹터 데이터연계하여 섹터별 등락률 구하기 및 코스피와 비교 1) MySQL에서 섹터 정보 불러오기(sector_info) - 앞서 저장한 MySQL DB에서 섹터 정보를 불러와보자, 전체 코드는 이렇다. import pymysql import pandas as pd # MySQL에서 Investar DB에 접속 conn = pymysql.connect(host='localhost', user='root', passwd='여러분비번', db='여러분DB', charset='utf8') sql = 'SELECT * FROM sector_info' sector_table = pd.read_sql(sql, conn) # sector_info Table을 read_sql()함수로 읽는다. sector..
종목코드별 주가 데이터 크롤링하여 저장하기 ※ 섹터 data MySQL Database에 저장하는 관련 포스팅은 하기 참고 바랍니다. https://wg-cy.tistory.com/95?category=1023254 [금융] 파이썬이용하여 코스피 대장주 찾기 Project-2(섹터 DB저장) 업종 & 섹터 산출 1. 업종 분류 현황 크롤링 (코스피 상장사) ※ 업종 분류 현황 크롤링하는 자세한 방법에 대해서는 하기 포스팅 참고 하면 좋을것 같다 https://wg-cy.tistory.com/54?category=1023254.. wg-cy.tistory.com 1) Database에서 종목 코드 정보 가져오기 import pymysql import pandas as pd # MySQL에서 Investar..