今天啊,咱们来做一个案例,Kaggle对它的用户关于数据科学方面的一些信息做的一个调查。

首先,我们来看一下这些调查信息包括哪些东西?

数据科学之路~

数据科学之路_数据科学

(一)数据领域的兄弟们的自身情况

  • 性别比例
  • 调查问卷国家分布
  • 年龄分布
  • 收入情况
  • 所学专业
  • 从事领域
  • 工作满意度
  • 最常使用工具
  • 常用算法
  • 计算平台选择
  • 面临挑战

(二)Python和R哪家强

数据科学之路_数据科学_02

  • 使用人数
  • 常用工具
  • 不同工种偏好
  • 各大领域使用趋势
  • 薪资待遇
  • 用了多少年
  • 重要程度

(三)数据科学家都在用什么

  • 国家分布
  • 使用Python or R
  • 工资与学历
  • 如何证明自己呢
  • 遇到的问题
  • 对可视化的重要程度
  • 求职的途径
  • 前一份工作和现在的对比

引入使用的包

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
plt.style.use('fivethirtyeight')
import warnings
warnings.filterwarnings('ignore')
import numpy as np
import plotly.offline as py
py.init_notebook_mode(connected=True)
import plotly.graph_objs as go
import plotly.tools as tls
import base64
import io
from scipy.misc import imread
import codecs
from IPython.display import HTML

更多文章请关注《万象专栏》