• 最新
  • 机器学习之特征工程

    这也并不,很多ML书籍都是以讲解算法为主,他们的目的是从理论到实践来理解算法,所以用到的数据要么是使用代码生成的,要么是已经处理好的数据,并没有提到特征工程。知道了特征工程是什么,那么我们必须要来了解下特征工…

    06-30 08:20 0 0 设计 大家 手工
  • 特征选择常用算法综述

    产生过程是搜索特征子集的过程,负责为评价函数提供特征子集。 算法描述:首先选择N个得分最高的特征作为特征子集,将其加入一个限制最大长度的优先队列,每次从队列中取出得分最高的子集,然后穷举向该子集加入…

    06-26 15:31 0 0 推广
  • 新手必看:数据分析10大方法!

    对比分析主要是指将两个相互联系的指标数据进行比较,从数量上展示和说明研究对象的规模大小,水平高低,速度快慢等相对数值,通过相同维度下的指标对比,可以发现,找出业务在不同阶段的问题。 转化漏斗分析是业…

    06-26 15:31 0 0 互联网 数据分析 对比
  • Python书籍|利用Python语言进行数据分析(第二版)

    关于问题的解决和Python语言如何高效地做数据工作,一方面,我的心得是 有必要阅读一些Python语言以及与数据主题相关的书籍(最好是有完整代码的和可以做代码迁移和应用的),另一方面,我的做法就是多用Pyt…

    06-20 16:00 0 0
  • 银行营销数据科学

    而我在为银行客户做数字化营销项目时,也是围绕上面三个方面展开更加细化的工作。 银行的客户类数据,产品类数据,营销类数据,风控类数据,信用类数据,对接第三方的数据等等,基于这些数据的探索,处理,分…

    05-04 12:00 0 0 短视频 视频 微信
  • 众包式阅读一本AI书籍

    我在 《众包式学习人工智能》 的文章里,倡导大家抱团学习AI,通过讨论和分享,实现共同进步。 这本书介绍了 一系列与AI相关的内容和技术,并且使用Python编程语言实现这些技术。 掌握从数…

    04-11 08:05 0 0 数据分析 人工智能 技术
  • 众包式学习人工智能

    我们时常听到或者实践的机器学习或者深度学习,可以理解AI的学习能力表现;我们所体验的刷脸支付,刷脸进高铁站等场景,可以理解为AI的感知能力的应用;AI在认知能力,目前还是个"婴儿",处于初级阶段,这也是…

    04-06 21:39 0 0 开发 人工智能 技术
  • 客户分群分析

    RFM(Recency,Frequency,Monetary)分析是一种基于客户行为数据做分群的方法。 rfm = uk_data.groupby( 'CustomerID').agg({ 'Inv…

    04-05 12:00 0 0 短视频 微信 视频
  • Python语言做数据可视化2本电子书

    我在本文介绍 2本Python语言做数据可视化的书籍,请参照我的阅读建议,选择合适的书籍阅读和应用。 1:若你想学习 Matplotlib库来创建有吸引力,洞察力的可视化,以从数据中获得高质量的洞见…

    03-24 12:20 0 0 专业 阅读 二本
  • 数据科学小技巧3:数据透视表

    第78篇原创文章,关于Python语言和数据科学。 1 使用Python语言实现数据透视表功能 我们用Python语言和pandas库轻松实现数据透视表功能。 第四步:数据透视表 1 …

    03-18 09:20 0 0
  • R语言做统计学3本电子书

    你们若是想利用自己 碎片化时间,学习一些 小知识或者小技巧,推荐你关注 王路情微信视频号,我目前分享了R 语言小知识,Python玩数据科学小技巧,大话人工智能系列等轻知识,每个一分钟时间,都会让你学习一点实…

    03-15 21:30 0 0 专业 阅读 大学
  • 你用微信视频号了吗?

    比方你是一个数据人,对数据这块感兴趣,可以关注我的视频号,我视频号专注分享数据方面的内容;另一方面,就是思考一下,有了视频号后,自己会分享什么内容,提前可以做一些准备,并且学习一下如何做短视频的一些方法和技巧…

    03-12 12:10 0 0 短视频 视频 微信
  • 基于PDFMV框架的Titanic的生存率挖掘

    对于最佳模型在 验证集上面进行预测和评估,以确定是否是最终模型,符合要求进入模型部署环节,若是无法满足期望,返回到数据阶段,特征阶段和模型构建和选择环节。 我们清楚了为什么要做,怎么做以及做什么后,…

    03-09 09:00 0 0
  • 数据科学小技巧1:pandas库apply函数

    把数据框的每一行或者每一列传送到一些处理函数,可以返回一些结果。 举例说明: 计算数据框每一列(变量)或者每一行(样本)的缺失值个数 print( '每一列缺失值的个数:') 关于 pand…

    03-08 09:30 0 0
  • Win10系统Python3连接Hive配置

    我通过网上查找资料和实际测试,把Win10系统Python3成功连接Hive配置总结如下。 我采用本地化安装方式,先下载impyla库的whl,如下图: 从Hive的一张表读取100条记录…

    02-21 08:02 0 0
  • PDFMV框架的P

    我们清楚问题为什么后,是时候考虑 “What-Problem”了,简称为 “问题的定义”。 2 合理化,我们要清楚所提出问题的基准线是什么,期望值是什么,所出背景和现状是什么,立足当下,实现增进。 …

    02-06 18:06 0 0 开发 360 微信
  • 集成特征选择

    集成特征选择是融合集成学习思想和特征选择方法,它结合了多个特征选择器的输出,通常可以提高性能,使得用户不必局限于选择单一的方法。 集成特征选择可以分为 同构的和异构的。 同构的,即对不同的训练数…

    01-14 15:34 0 0
  • 数据可视化分析

    3 了解常用的数据可视化分析工具简而言之,数据可视化分析就是针对问题所需的数据,通过可视化的方式,进行分析,以发现洞见和做出决策的系统化过程。 我们想要灵活使用数据可视化分析,掌握一些常用的数据可视…

    01-11 10:07 0 0 开发 设计 计算机

数据科学自媒体

0

总阅读量

227

总内容量

数据科学自媒体