목록Data Scientist/Python (41)
삶의 공유
안녕하세요 오늘은 Python의 Seaborn 라이브러리를 활용해서 데이터시각화를 한번 해보고자 합니다. Seaborn라이브러리는 matplot 보다 더 나은 기능을 제공합니다. 관련해서 seaborn 라이브러리 문서를 보고싶으시다면 하기 링크를 클릭 해주시면 됩니다. https://seaborn.pydata.org/examples/index.html Example gallery — seaborn 0.11.2 documentation seaborn.pydata.org 자 이제 예제로 들어가보겠습니다. 먼저 seaborn 라이브러리를 포함하여 데이터 시각화를 위해 필요한 여러 라이브러리를 호출해보겠습니다. import pandas as pd import numpy as np import matplotlib..
안녕하세요 ! 이번 포스팅에서는 Python을 활용하기 위한 준비로 웹크롤링을 하기 위한 Chrome Driver 설치와 Selenium의 활용법에 대한 포스팅을 준비해보았습니다. Chrome Driver 설치 및 Selenium 활용 먼저 본인의 크롬의 버전을 확인해봐야 합니다. 좌측 하단의 Chrome 정보를 클릭 하시면 중앙부에 버전을 확인 하실 수 있습니다. 확인 하신 후에 아래의 링크를 통해 크롬 드라이버를 다운 받습니다. https://chromedriver.chromium.org/downloads ChromeDriver - WebDriver for Chrome - Downloads Current Releases If you are using Chrome version 97, please do..
이번 포스팅에서는 Matplotlib에 대해서 같이 공부해보도록 하겠습니다. Matplotlib는 데이터들을 시각화 하여 분석에 좀 더 직관적으로 보일 수 있게 해주는 것 라이브러리라고 보시면 됩니다. 1. Line Plot 데이터는 구조는 다음과 같습니다. 이것을 가지고 시간에 따른 AAPL의 주가 변동 현황을 Line plot으로 그려보겠습니다. 해당 데이터 프레임(stock_df)에서 바로 matplotlib를 호출 할 수 있습니다. 이는 pandas내에 matplotlib 기능이 포함이 되어있기 때문입니다. 어떤 기준으로 설정했는지 같이 한번 살펴보겠습니다. x축에 'Date' 컬럼을 설정 y축게 'AAPL'의 주가를 설정 label에 'APPLE Stock price' linewidth는 굵기 ..
지난 포스팅에 이어서 이번 포스팅에서도 Pandas 라이브러리의 응용과정을 알아보겠습니다. 앞 포스팅을 안보셨던 분들은 아래 링크 클릭 해주시면 됩니다! https://wg-cy.tistory.com/115 [Python 기초] Pandas(dataframe만들기, CSV/HTML로 Data 불러오기) Pandas Basics 파이썬에서 데이터 분석을 하기 위한 중요한 라이브러리 이고, 파이썬에서의 엑셀 이라고 볼수 있다. 데이터 프레임은 데이터를 행과 열을 이용하여 데이터를 다루는 영역이다. 시리 wg-cy.tistory.com 이번에는 Dataframe을 가지고 지지고 볶고 하는 데이터분석을 위한 기초를 쌓는 과정이라고 보시면 됩니다. 먼저 DataFrame을 만들어보겠습니다. bank_client_..
오늘은 파이썬 텍스트 마이닝을 하기 위한 준비 과정인 "네이버 API 이용 신청" 하기 포스팅 입니다. 1) 아래에 있는 url에 들어갑니다. ※url: https://developers.naver.com/products/service-api/datalab/datalab.md 2) 서비스 API > 데이터 랩에 들어갑니다. 3) 스크롤을 좀 내리다 보면 오픈 API 이용 신청 버튼이 있는데 이것을 클릭합니다. 4) 네이버 로그인을 합니다. 만약 네이버 로그인이 기존에 되어있으면 별도로 이런 과정이 생략됩니다. 5) 이용 약관에 동의 후 다음 스텝으로 넘어갑니다. 6) 휴대폰 인증까지 하면 하기 화면으로 넘어갑니다. 다음 화면에서 사용하고 싶은 API를 선택합니다. 7) 여기서 환경 추가가 중요한데 안드로..
Pandas Basics 파이썬에서 데이터 분석을 하기 위한 중요한 라이브러리 이고, 파이썬에서의 엑셀 이라고 볼수 있다. 데이터 프레임은 데이터를 행과 열을 이용하여 데이터를 다루는 영역이다. 시리즈는 데이터 프레임의 하나의 열, 배열이라고 볼수 있다 처음은 이게 무슨말인지 이해가 안될 수 있다. 하나씩 차근 차근 알아가보자 먼저 판다스 라이브러리를 호출 해보자. 다음과 같이 코드를 작성하면 된다. import pandas as pd 먼저 2개의 리스트를 만들어보자 my_list = ['AAPL', 'AMZN', 'T'] label = ['stock#1','stock#2','stock#3'] [Series] 시리즈는 판다스의 일차원 배열이라고 보면 된다. 이 시리즈는 데이터와 별명을 기반으로 이루어진다..