목록Python (25)
삶의 공유
안녕하세요 ~~ 이번에는 2번째 프로젝트이자, 제 개인적으로 공부하는 것들을 응용해보자 합니다. 그래서 생각 한 주제는 바로 ! 종목별 Valuation 및 저평가 주식 Search 자동화 Project 입니다. 말은 어렵게 보이실수도 있지만 사실 크게 어려운 것이 아닙니다. 제가 이전에 포스팅 해드렸던 네이버 크롤링, Pandas 만 잘 활용하시면 아무 문제가 되질 않습니다 ! 이번에는 시각화 까지 활용해서 좀 더 그럴 듯 하게 만들어 보고자 합니다. 첫번째 대장주 찾기 Project의 결과물은 시각화 적으로 아무래도 미진한 부분이 많았습니다....ㅎㅎ 이렇게 지속적으로 개인 프로젝트를 진행하다보면 많이 발전이 있을거라 생각합니다...ㅎㅎㅎ Valuation의 방법은 여러가지가 있지만 대표적으로 5가지..
안녕하세요 ! 이번 포스팅에서는 텍스트 마이닝을 위한 맥북 상태에서 환경 설정 하기 포스팅 입니다. 여러 시행 착오를 겪고 나서 정리하는 포스팅이라서 많은 분들께 도움이 될 수 있을 것 같아 이렇게 글을 쓰게 되었습니다. ※ 아나콘다는 기 설치 완료 된 것을 가정으로 하고 적은 포스팅 입니다. 참고 부탁드립니다. 1) JDK 설치 맥북은 기본적으로 Java가 설치되어 있지만, 혹시나 설치가 안되어 있는 분들을 위한 작업 입니다. - Google에서 JDK라고 검색을 합니다 - 여기서 본인의 맥북 사양에 맞게 다운로드를 받아서 설치 합니다 ※Arm64 (애플 M1 64bit) / x63 (인텔 CPU 64bit) 2) Homebrew - 아래 사이트에 들어가서 스크립트를 복사합니다. https://brew..
안녕하세요 오늘은 Python의 Seaborn 라이브러리를 활용해서 데이터시각화를 한번 해보고자 합니다. Seaborn라이브러리는 matplot 보다 더 나은 기능을 제공합니다. 관련해서 seaborn 라이브러리 문서를 보고싶으시다면 하기 링크를 클릭 해주시면 됩니다. https://seaborn.pydata.org/examples/index.html Example gallery — seaborn 0.11.2 documentation seaborn.pydata.org 자 이제 예제로 들어가보겠습니다. 먼저 seaborn 라이브러리를 포함하여 데이터 시각화를 위해 필요한 여러 라이브러리를 호출해보겠습니다. import pandas as pd import numpy as np import matplotlib..
지난 포스팅에 이어서 이번 포스팅에서도 Pandas 라이브러리의 응용과정을 알아보겠습니다. 앞 포스팅을 안보셨던 분들은 아래 링크 클릭 해주시면 됩니다! https://wg-cy.tistory.com/115 [Python 기초] Pandas(dataframe만들기, CSV/HTML로 Data 불러오기) Pandas Basics 파이썬에서 데이터 분석을 하기 위한 중요한 라이브러리 이고, 파이썬에서의 엑셀 이라고 볼수 있다. 데이터 프레임은 데이터를 행과 열을 이용하여 데이터를 다루는 영역이다. 시리 wg-cy.tistory.com 이번에는 Dataframe을 가지고 지지고 볶고 하는 데이터분석을 위한 기초를 쌓는 과정이라고 보시면 됩니다. 먼저 DataFrame을 만들어보겠습니다. bank_client_..
오늘은 파이썬 텍스트 마이닝을 하기 위한 준비 과정인 "네이버 API 이용 신청" 하기 포스팅 입니다. 1) 아래에 있는 url에 들어갑니다. ※url: https://developers.naver.com/products/service-api/datalab/datalab.md 2) 서비스 API > 데이터 랩에 들어갑니다. 3) 스크롤을 좀 내리다 보면 오픈 API 이용 신청 버튼이 있는데 이것을 클릭합니다. 4) 네이버 로그인을 합니다. 만약 네이버 로그인이 기존에 되어있으면 별도로 이런 과정이 생략됩니다. 5) 이용 약관에 동의 후 다음 스텝으로 넘어갑니다. 6) 휴대폰 인증까지 하면 하기 화면으로 넘어갑니다. 다음 화면에서 사용하고 싶은 API를 선택합니다. 7) 여기서 환경 추가가 중요한데 안드로..
Pandas Basics 파이썬에서 데이터 분석을 하기 위한 중요한 라이브러리 이고, 파이썬에서의 엑셀 이라고 볼수 있다. 데이터 프레임은 데이터를 행과 열을 이용하여 데이터를 다루는 영역이다. 시리즈는 데이터 프레임의 하나의 열, 배열이라고 볼수 있다 처음은 이게 무슨말인지 이해가 안될 수 있다. 하나씩 차근 차근 알아가보자 먼저 판다스 라이브러리를 호출 해보자. 다음과 같이 코드를 작성하면 된다. import pandas as pd 먼저 2개의 리스트를 만들어보자 my_list = ['AAPL', 'AMZN', 'T'] label = ['stock#1','stock#2','stock#3'] [Series] 시리즈는 판다스의 일차원 배열이라고 보면 된다. 이 시리즈는 데이터와 별명을 기반으로 이루어진다..