본문 바로가기

스포츠 데이터 분석4

KBO 준플레이오프 5차전 LG : KT 프리뷰 안녕하세요.오늘은 내일 진행 예정인 KBO 준플레이오프 5차전 프리뷰 및 분석해 보겠습니다.(LG트윈스 팬이라 주관적인 리뷰가 될 예정이니 양해 부탁드리겠습니다.) 이전에 작성한 포스팅의 내용인 크롤링한 데이터와 최근 전적으로 분석을 해보려고 합니다. 이전 포스팅이 궁금하신 분들은 아래 링크를 통해 확인하실 수 있습니다. https://knowing-j1n.tistory.com/entry/%EB%84%A4%EC%9D%B4%EB%B2%84-%EC%8A%A4%ED%8F%AC%EC%B8%A0-%EC%95%BC%EA%B5%AC-%EC%9B%B9%EC%82%AC%EC%9D%B4%ED%8A%B8-%ED%81%AC%EB%A1%A4%EB%A7%81 네이버 스포츠 (야구) 웹사이트 크롤링네이버 스포츠 웹사이트 크롤링을 .. 2024. 10. 10.
R studio 를 활용한 배구 기사 워드 클라우드(World Cloud) 생성하기 오늘은 워드 크라우딩을 한번 해보겠습니다. 사용할 URL은 아래와 같습니다. https://sports.news.naver.com/volleyball/index 배구 : 네이버 스포츠스포츠의 시작과 끝!sports.news.naver.com 사용한 library 와 변경한 파라미터들은 아래와 같습니다. library(rvest) : R에서 웹 스크래핑(Web Scraping)을 쉽게 할 수 있도록 도와주는 라이브러리 library(tm) : 텍스트 마이닝(Text Mining)을 위한 라이브러리. library(wordcloud) : 텍스트 데이터를 시각화하는 데 사용되는 워드 클라우드를 생성하는 라이브러리 library(RColorBrewer) : 데이터 시각화를 위한 색상 팔레트를 제공하는 라이브러리.. 2024. 8. 30.
네이버 스포츠 (야구) 웹사이트 크롤링 네이버 스포츠 웹사이트 크롤링을 한번 해보겠습니다.사용할 URL은 아래와 같습니다. https://www.koreabaseball.com/Record/TeamRank/TeamRankDaily.aspx KBO 홈페이지KBO, 한국야구위원회, 프로야구, KBO 리그, 퓨처스리그, 프로야구순위, 프로야구 일정www.koreabaseball.comhttps://m.sports.naver.com/game/20240827KTLG02024/preview   주로 selenium webdriver chrome을 사용하여 사이트를 크롤링 했습니다. 우선  순위표는 BeautifulSoup를 사용하여 크롤링 하였습니다. 가져온 데이터는 csv파일로 저장을 하여 읽는 방식을 택했습니다.  또한 순위표가 반영된 날짜의 기준을.. 2024. 8. 28.
2023-24 남자배구 순위표 데이터 시각화 https://sports.news.naver.com/volleyball/record/index 네이버 스포츠스포츠의 시작과 끝!sports.news.naver.com네이버 순위표를 크롤링해서 데이터프레임을 생성 후, 각 지표를 시각화 하여 팀별 순위를 파악했습니다.리그 평균 수치 파악을 위해 리그 평균 이라는 행을 추가합니다.지금부터 각 수치들에 대한 의미 설명 및 시각화를 진행해 보겠습니다.세트득실률이란 팀이 이긴 세트 수를 진 세트 수로 나눈 비율을 의미합니다.세트득실률이 높을수록 팀의 성과가 좋다는 것을 의미합니다.   팀 순위 1위인 대한항공이 1.615로 가장 높은 세트득실률을 기록하고 있습니다. 그 뒤로 우리카드가 1.474로 2위를 기록하고 있습니다.리그평균은 약 1.07로 나머지 5팀이 .. 2024. 6. 30.