분류 전체보기
[Kaggle] 타이타닉 생존자 예측
Exploration in Titanic Introduction Titanic: Machine Learning from Disaster 주제 : Explore 단계를 스스로 생각해서 진행해보자 data description summary 타이타닉 호의 침몰 당시 승객 데이터를 이용하여 생존자를 예측 891개의 트레이닝 데이터와 418개의 테스트 데이터를 미리 분리시켜 놓은 상태 기존에 한 번 진행해봤던 분석이기 때문에 랜덤 포레스트를 이해하고 예측력을 높이는 것에 초점 이 커널은 Titanic Data Science Solutions - Manav Sehgal의 내용을 따라한 부분이 매우 많습니다. SEMMA 방법론에 따라 분석을 진행하였습니다. 2018-03-06에 작성한 글 1. Sample # da..
[Kaggle] 뉴욕 택시여행 기간 예측
New York City Taxi Trip Duration 2018-01-31에 작성한 글 분석 공부를 위해 캐글의 대회들 중 좋은 성적을 받았던 커널들을 따라해보려고 합니다. 0. Competition Introduction 이 대회에서의 목적은 뉴욕에서의 택시 여행 기간을 예측하는 모델을 만드는 것으로서, 가장 성과측정치가 좋았던 사람을 뽑는 것보다는 통찰력 있고 사용 가능한 모델을 만드는 사람에게 보상을 지불하는 형태로 진행되었다. 성과측정치는 다음과 같다. $$ \epsilon =\sqrt { \frac { 1 }{ n } \sum { i=1 }^{ n }{ { (log({ p }{ i }+1)\quad -\quad log({ a }_{ i }+1)) }^{ 2 } } } $$ Where: ϵ i..
[GCP] 구글 클라우드 플랫폼으로 분석 환경 무료로 만들기
Tensorflow을 활용한 딥러닝 분석 환경 구축 2018-09-30에 작성한 글 저와 같은 학생들에게 딥러닝을 공부하면서 가장 큰 문제는 컴퓨팅 능력일 것입니다. 큰 데이터를 활용해서 많은 노드와 여러 개의 레이어를 쌓은 신경망을 노트북의 보잘것없는 CPU로 학습하려고 하면 정말 오래 걸립니다. 그래서 꾸역꾸역 공개된 서버의 Jupyter Notebook을 활용해서 학습하더라도 기본적으로 몇 시간, 넘어서는 몇 일 동안 학습을 진행하는 모습에 가슴이 답답해져서 GCP를 이용하고자 마음 먹었습니다. GCP(Google Cloud Platform)은 구글에서 Compute Engine, Storage, Network 등을 클라우드 환경에서 빌려 사용하고 사용한 만큼 금액을 지불하는 서비스입니다. 하지만 ..
[게임데이터 분석] League Of Legends(롤) 바텀 듀오 티어 계산
분석의 목적 친구랑 같이 롤을 즐길 때에는 봇 듀오로 같이 가는 경우가 많다. 하지만 나는 일반 게임이나 랭크 게임에서는 오로지 탑만 가는 진정한 탑 솔로이므로 원딜과 서포터의 어떤 조합이 좋은지 잘 모른다. 그래서 이번 분석에서 어떤 원딜, 서폿 조합이 가장 좋은지 데이터를 통해 알아내고자 한다. 이외에도 각자의 플레이 스타일에 맞는 아이템 추천, 탑 또는 미드와 정글의 조합, 5인 팀 게임의 조합 등과 같이 해보고 싶은 분석은 많지만 이번 분석에서는 원딜과 서폿의 조합 티어를 밝혀내는 것 을 분석의 목적으로 한다. 계산 과정이 오래 걸리는 코드는 첫 계산 이후 주석 처리하고 저장 후 불러오는 방식으로 사용하였습니다. 1. 데이터 저장 # 패키지 불러오기 import pickle # 리스트 안의 데이터..
[게임데이터 분석] BattleGround(배틀그라운드) 프로경기 이동 패턴 분석
분석 배경 이전에 입사 사전과제로 분석했던 내용인데, 원하는 만큼의 퀄리티가 나오진 않았습니다. 천 만 행이 넘는 큰 JSON 파일을 분석해본 경험도 처음이었고, 배틀그라운드에 대한 기본적인 지식도 부족했던 것 같네요. 특히 일반 유저들과 프로 선수들의 경기가 매우 큰 차이가 있다는 것을 알고, 엎고 다시 진행했던 것이 시간을 많이 날려먹었습니다. 총 분석 기간은 8일 정도였고, 부족한 분석이었지만 올려둡니다. # 패키지 불러오기 # api 요청 import requests import json # 데이터 자료형 및 분석도구 import pandas as pd import numpy as np # 시각화 패키지 import matplotlib as mlp import matplotlib.pyplot as..