一周机器学习周记

1.TensorFlow意况搭建完工

时间:2018.01.21.一周

2.把jupyter notebook 用起来

最主要内容


1.收拾前期关于决策树的多个Mini施行花色文书档案(推行进行中)

2.搭建TensorFlow环境(进行中)

3.扩充:实行Python的自动化模块pyautogui模块

4.前期承得前组织带头人吴师兄的参照文书档案,开端对腾讯算法大赛进展项目钻探

3.扩充:实施Python圈中的符号计算库-Sympy

内容摘要及有关概况


4.卫冕对Tencent算法大赛进行项目商讨

决策树施行项目

详见花色文书档案

4.1 为更加的了然认识机器学习的流水生产线,施行了三个小型精简项目(关于sklear提供的数量集iris)

搭建TensorFlow环境

1.通过pip安装TensorFlow基本包

2.在cmd处import tensorflow

3.依据提示,在官方网址下载对应的CUDA版本,下载实现后进行安装(安装此前先卸载本地的旧版本)

4.下载cuDNN对应的压缩包

4.2 特征工程在项目中举住轻重,因此本周还拜读了一篇有关于特征工程的不错小说并实践了有关实例

pyautogui模块

本周实行了一类别pyautogui模块的函数,这里主要摘要二个举办:

功能

实时给出鼠标当前地方的x、y坐标,也提交这些像素的凯雷德GB颜色

代码

图片 1

TensorFlow情形搭建

具体内容整理于文书档案 关于TensorFlow的设置和心得

腾讯算法大赛

参照于前社长吴师兄的文书档案

本周进程

由赛题属于广告学范畴,一开始通过对 转化率预估此篇小说的读书,对相关概念有所驾驭

随着,阅读明白了 Tencent算法大赛以及 FAQ 部分

赛题要求

法定提供17-30天活动 应用程式 的广告、客户的转载情形,及相关上下文, 依据那个数量预测第31天钦赐客户和相应广告的转速率.

评估办法 (赛题中提供的总结公式)

透过Logarithmic Loss评估(越小越好),公式如下:

图片 2

其中,

N是测量检验样本总的数量,

yi是二值变量,取值0或1,表示第i个样本的label,

pi为模型预测第i个样本 label为1的可能率。

演示代码(Python语言实现):

图片 3

类型目标

要害在于剖判和上学大赛前收获 第64 名大腕的享受, 对其代码实行通晓和剖判, 主要着注重在于特征工程。

机器学习的十分重要流程

图片 4

机械学习流程

数量剖判和洗刷方式

图片 5

至于数据深入分析,阅读FAQ可知:

App 的激活定义为客户下载后开发银行了该App,即发生激活行为。从客户点击广告到广告系统查出客商激活了App(假设有),平时会有较长的光阴距离,首要由以下两地点原因形成:

1) 客户大概在下载之后过了比较久才起步App;

2) 顾客运行App的表现供给广告主上报回传给广告系统,平时会有早晚的延时。

这里回流时间代表了广告主把App激活数据反馈给广告系统的光阴,回流时间当先5天的数码会被系统忽略。

值得注意的是,本次竞赛的练习多少提供的了断第31天0点的广告日志,因而,对于最终几天的教练多少,某个label=0并远远不够标准,或然广告系统会在第31天未来获悉label实际上为1。

少数app和客商的笔录相当少

末段几天有部分数据不准确

对于这些难点, 这里运用了比较暴力的章程, 将最后几天这个大概会冒出问题的数额删除

jupyter notebook

具体内容整理于文书档案 关于Jupyter notebook的安装以及一些应用体验

Sympy库提供了成都百货上千符号总括的法子函数,如解方程、解方程组(二式二元三回方程组能够用一行代码解决)、函数赋值运算、求导数及偏导数、求积分、求极限的函数等等,十三分实用,方便急速!此处附上相关文档链接。

具体内容整理于文书档案 关于Tencent算法大赛

参照文书档案 scikit-learn-intro

品类一思路及步骤总计

1.抽出特征

2.散点图案(x,y|萼宽,瓣长)实现直观布满

3.染色到位分类(染色分类依靠每条记下对应的target属性值及其值对应的target_names,即何值何类何色)

补给:关于clim函数:matplotlib官方文书档案->docs->The Pyplot API->clim

种类一代码解析

图片 6

项目一实现

图片 7

品类二代码

图片 8

项目二贯彻

图片 9

参照他事他说加以考察文档 使用sklearn做单机特征工程

补充

1.哑编码实例:(参考于应用scikit-learn对数码举办预管理

>>>from sklearn.preprocessing import OneHotEncoder

图片 10

2.三番五次型特征:相对于离散型特征来讲

3.缺失值

  1. “2.5 数据转换”中多项式的“度”:可以联想一下“阶”举行观念

5.关于lamda :python lambda的用法

6.有关filter对象的注意事项:filter函数

7.使用sklearn练习LDA核心模型及调参详解

本文由365bet体育在线官网发布于网络编程,转载请注明出处:一周机器学习周记

TAG标签:
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。