🗒️ 基于SparkSQL的电影分析项目实战

在本篇分享中,将尝试实现一个完整的基于SparkSQL的电影分析项目案例,完整的代码已上传至 GitHub,想看完整代码可以去 clone,记得给个 Star。以下是全文,希望本文对你有所帮助。

🗒️ Spark学习笔记

本文记录了学习 Apache Spark 时的一些知识点,内容主要涵盖Spark RDD、Spark SQL、Spark Streaming等的基本概念及部分代码,欢迎浏览我的博客,希望能够与大家共同探讨与交流大数据挖掘相关技术。

🗒️ 数据挖掘学习手记 | 三

• 标准化方法及其相关公式 • 向量 • 断言 • 交叉验证 • Kappa指标

🗒️ 数据挖掘学习手记 | 二

• 显式评价 • 隐式评价 • 哪种评价方式更准确? • 基于用户的协同过滤 • 基于物品的协同过滤 • 修正的余弦相似度 • Slope One算法 • Slope One的Python实现

🗒️ 数据挖掘学习手记 | 一

数据挖掘解决的问题是什么? 现代社会拥有海量的数据量,如何从海量的数据中提取出有用的信息

🧩 基于Python实现拼音输入法

本文介绍了如何基于Python实现拼音输入法,包括数据预处理、生成汉字频数矩阵、构建隐马尔科夫模型以及使用维特比算法解码输入的拼音,生成最可能的汉字序列。具体步骤包括处理语料库、统计汉字频数、建立拼音与汉字的对应关系,并通过算法测试输入法的准确性。

🧩 网络设计与集成教学楼结构化布线系统设计

本文主要讨论了教学楼结构化布线系统的设计,包括项目背景、目标、范围以及参考标准与规范。具体内容涉及用户需求、网络性能和安全合规性需求分析,以及综合布线系统的设计原则和要求。文章详细介绍了工作区子系统、水平干线子系统、管理间子系统、垂直干线子系统和设备间子系统的设计。

How To Ask Question

本文主要讲述了如何有效地提问,包括选择合适的提问论坛、使用明确的标题、提供清晰准确的问题描述、以及避免无意义的提问等关键点。

🗒️ 什么是Pipline

最近看论文的时候总是看到 pipline 中文翻译是管道(流水线),但是总好像不太明白这是个什么东西,于是查了查资料整理记录了下来。

🗒️ Win10中文输入法显示异常解决方案

最近电脑在长时间睡眠(未关机)重启时总是出现中文键盘无法显示的问题,之前每次都是通过重启进行解决,但是由于我本身用电脑没有关机的习惯,频繁的重启实在让我有点受不了了,遂尝试解决。