使用矩阵分解查找相似的名称
我们的一个爱好项目是名字推荐系统NamesILike.com, 这已经不是什么秘密了。在问了20个问题以找出他们的口味之后, 该网站向用户推荐了名字。将来的父母通常会使用它来为预期的孩子取一个名字。 像这样的推荐系统在数据科学领域很热门!著...
我们的一个爱好项目是名字推荐系统NamesILike.com, 这已经不是什么秘密了。在问了20个问题以找出他们的口味之后, 该网站向用户推荐了名字。将来的父母通常会使用它来为预期的孩子取一个名字。 像这样的推荐系统在数据科学领域很热门!著...
本文概述 While循环 对于循环 While与Python中的For循环 嵌套循环 中断并继续关键字:创建无限循环 range()与xrange() 磨练你的Python技能! 循环在Python或任何其他编程语言中都很重要, 因为它们可...
本文概述 潜在狄利克雷分配:简介 词嵌入 lda2vec 总结 这篇博客文章将为你介绍Chris Moody在2016年发布的主题模型lda2vec。lda2vec扩展了Mikolov等人描述的word2vec模型。于2013年推出主题和文...
本文概述 “性感”的含义:尚无真实答案(尚未) 通过神秘的资源广场学习数据科学 真正学习数据科学的关键 “性感”的含义:尚无真实答案(尚未) 尽管仍然很难就数据科学的精确定义或数据科学家的角色...
Glassdoor在2012年被《哈佛商业评论》(Harvard Business Review)誉为” 21世纪最勤奋的工作”之后, 将其评为2016年”年度最佳工作”。 但是, 在过去的四...
本文概述 如何从监督学习开始 导入数据并签出 可视探索性数据分析(EDA)和你的第一个模型 有关特征变量的EDA 进一步探索你的数据! 具有数字变量的EDA 从EDA到机器学习模型 本月初, 我做了一个Facebook Live Code ...
本文概述 Google Compute Engine 虚拟机, 磁盘, 映像和快照 GCP上的第一个VM入门 创建一个实例 Google的Cloud Shell Debian软件包 总结 尽管AWS EC2是云计算的领导者, 但Google...
本文概述 建立你的第一个机器学习模型 建立决策树分类器 什么是决策树分类器? 为什么选择max_depth = 3? 总结 建立你的第一个机器学习模型 有了探索性数据分析(EDA)和基线模型, 你就可以开始研究第一个真正的机器学习模型。 请...
本文概述 为什么要生成随机数据集? 基于模式的随机数据生成:我们需要良好的关系! 使用Trumania生成相互关联的数据(又称教程时间!) 总结 编者注:这篇文章是与Milan van der Meer合作撰写的。这篇文章的两位作者都在Re...
数据科学有其自己的语言。因此, 如果你希望至少有一点机会在明天的企业界中生存-由于其专注于收集和分析数据-最好从昨天开始学习该术语。 幸运的是, 受到TechCrunch上”如何讲启动”一文的启发, 在线数据科学学校...