大数据计算学习笔记打卡（2.2）

今日的内容是【大数据计算】第二课的课程学习笔记

课程内容大部分都是分类和对比，包括表格数据与非数据表格的对比、描述性分析与预测性分析的对比、分类与回归的对比。

好啦，来看看吧！

预测性（监督）：标签（知道所有标签进行分类）

描述性（非监督）：非标签（未知标签、未知数据，努力弄清楚标签和分类）

数据集分为训练集和测试集，一般来说，70%的训练集和30%的测试集，我们运用训练集来训练模型，不断优化参数形成算法，并用测试集评估算法，测试集是有标签的数据集，算法优化完成后，就可以运用其来锻炼未知数据集了。

在训练数据过程中，会有实际数据和预测数据。

分类：包括分类算法、决策树、分类法则等。

KNN，K Nearest Neighbor K最近邻居法则。

要点：Support（A B）和Confidence（A B）的计算。

展开阅读全文

页面更新：2024-04-02

标签：数据算法法则课程内容要点表格邻居模型标签测试

1 2 3 4 5

崂山区62个项目集中开工计划总投资306亿元

青岛新闻网2月2日讯（记者朱颖）2月1日，青岛市举行城市更新和城市建设2023年一季度集中开工仪式。崂山区在青岛人工智能科技创新中心项目设立分会场，举行项目集中开工仪式。区委书记张元升，区委副书记、区长杨克敏，区人大常

一文盘点2023CES智能驾驶供应链

作者 | 宋怡 2023年国际消费电子展（CES）已正式闭幕，自动驾驶产业链上各细分赛道以及各大车厂纷纷展现了各自的新产品、新技术。九章智驾按照芯片/域控制器、自动驾驶解决方案、感知、控制、仿真测试、整车和其他，共分七

详解CAN总线：CAN协议分层结构及功能

CAN协议涵盖了 ISO 规定的 OSI 基本参照模型中的传输层、数据链路层及物理层如下表所示。 CAN 协议中关于 ISO/OSI 基本参照模型中的传输层、数据链路层及物理层，具体定义如下图所示。数据链路层分为 MAC 子层和 LLC

性能堪比游戏本的轻薄本联想小新Pro 16外观首曝

今年1月，联想小新官方微博发布消息透露了联想小新Pro16轻薄本的卖点信息，其中115W的整机性能释放受到了用户的关注，不少网友称该轻薄本的性能已经达到了游戏本的水准，或对其它入门级游戏本产品造成威胁。2023年，全新的英特

荣耀30等多款荣耀旧机型将接收鸿蒙3.0更新一季度开启

【手机中国新闻】众所周知，作为国产手机中的佼佼者，华为最大的依仗便是自研芯片以及自研系统。在多种因素的影响之下，华为的麒麟芯片在短期内我们已经很难见到。在这种情况下，华为也是将更多的精力灌注在手机系统之上。早

三星、谷歌和高通联手，打造全新混合现实平台

IT之家 2 月 2 日消息，三星电子在今天凌晨举行的 Unpacked 2023 活动上发布了新一代 Galaxy S23 系列手机，该公司在活动上还表示，将与谷歌和高通公司合作开发一个即将到来的混合现实（XR）平台。三星没有提及是否有任何具体

元宇宙电子商务平台Emperia完成1000万英镑融资

英国元宇宙电子商务平台Emperia完成了由索尼创新基金、Base10 Partners、Daphni、Background Capital、Stanford Capital Partners、Concept Ventures和企业家Jay Radia投资的1000万英镑融资。Emperia致力于通过虚拟

拿捏红米K60？博主分析一加Ace2：用灵活优势收拾小米

在春节假期过后，各大手机厂商也都开始为新机做准备，三星、一加、realme、荣耀都纷纷官宣。要说近期热度最高的，那肯定是一加，在数字旗舰一加11发布不到一个月之后，又官宣了一加Ace 2将在2月7日14:30正式亮相，并且还表示方新

MIUI 14第二批升级名单公布，小米11全系都有，小米10还有机会吗？

相比MIUI 13，MIUI 14的跨度还是非常大的，其主打精简系统的特色也受不少米粉的欢迎。相信大家经过这段时间的体验，对于MIUI 14的表现也已经有了更深的体会。现在相比MIUI 14值不值得升级，更多人关心的应该是MIUI 14什么时

科技股刚刚经历了几十年来最好一月但这可能不是一个好兆头

科技股迎来了20多年来最好的年初，但这实际上可能是一个不祥的信号。道琼斯市场数据的数据显示，2023年第一个月，纳斯达克综合指数上涨10.7％，是自2001年上涨12.2％以来的最佳1月份表现。但2001年的涨势随后大幅降温:纳斯达克指

又一家！巨头陆金所控股提交港交所上市申请，金融科技中概股回归热潮将至？

北京商报讯（记者廖蒙）又一家金融科技中概股回归港股。2月1日，美股上市公司陆金所控股向港交所正式递交上市申请，拟以介绍方式在港交所主板上市。上市成功后，陆金所控股将实现纽交所、港交所双重主要上市。摩根大通、摩根

聊聊马斯克眼中最牛的特斯拉黑科技：热泵技术！

2020年特斯拉首次将热泵空调搭载在了热销车型Model Y上，目前特斯拉旗下的所有车型都配备了热泵空调，大大改善了特斯拉车子在严寒条件下的空调能耗，搭载热泵空调的车子比不搭载该设备的车子能耗要低3倍，因此成为了钢铁侠马

距地球16亿公里喷出200公里的水柱，这颗星球让科学家彻底震惊！

地球上的生命很有多样性，不是所有生活形态都需要氧气，也不是所有生活形态都需要阳光，但地球上的每种生活形态，无论多么不同都需要液态水。火星上最有可能找到液态水的地方可能藏在地表之下。科学家相信并非所有火星的水分

三星Galaxy Book 3 Ultra真机上手：配OLED屏幕，支持S Pen

IT之家 2 月 2 日消息，三星在今天凌晨 2 点召开的 Galaxy Unpacked 发布会上，在推出全新的 Galaxy S23 系列机型之外，还推出了 Galaxy Book 3 Ultra 这款笔记本。这是一款采用二合一可转换设计、配备 S Pen 手写笔的高端

Kafka入门教程（基于C# ）

一、搭建 Kafka 环境本章的内容比较简单，我们将使用 Docker 快速部署一个单节点的 Kafka 或 Kafka 集群，在后面的章节中，将会使用已经部署好的 Kafka 实例做实验，然后我们通过不断地实验，逐渐了解 Kafka 的知识点以及掌握

上滑加载更多 ↓

大数据计算学习笔记打卡（2.2）

崂山区62个项目集中开工计划总投资306亿元

一文盘点2023CES智能驾驶供应链

详解CAN总线：CAN协议分层结构及功能

性能堪比游戏本的轻薄本联想小新Pro 16外观首曝

荣耀30等多款荣耀旧机型将接收鸿蒙3.0更新一季度开启

三星、谷歌和高通联手，打造全新混合现实平台

元宇宙电子商务平台Emperia完成1000万英镑融资

拿捏红米K60？博主分析一加Ace2：用灵活优势收拾小米

MIUI 14第二批升级名单公布，小米11全系都有，小米10还有机会吗？

科技股刚刚经历了几十年来最好一月但这可能不是一个好兆头

又一家！巨头陆金所控股提交港交所上市申请，金融科技中概股回归热潮将至？

聊聊马斯克眼中最牛的特斯拉黑科技：热泵技术！

距地球16亿公里喷出200公里的水柱，这颗星球让科学家彻底震惊！

三星Galaxy Book 3 Ultra真机上手：配OLED屏幕，支持S Pen

Kafka入门教程（基于C# ）

黑暗森林法则不应当是宇宙的全部

春节到底多少人出门旅游了？刚刚，数据公布！

千万级数据，如何做性能优化？分库分表、Oracle分区表？

给2023的7个生活法则

马蜂窝元宵节大数据：各地花灯平均热度上涨120%，年轻人热

第三方独立测试龙头，伟测科技：受益半导体国产+芯片设计

Xplore获美国NOAA的遥感许可，将提供先进空间数据产品

我们的邻居半人马座a星即南门二的故事

艾尔登法环新DLC啥时候出？老头环Steam后台数据更新！

3件衣服法则太赞了，上衣到裤装只选3件，就搭出9套简洁好