爬虫入门(这玩意儿懂的都懂)


第一章:爬虫原理和数据爬取 1.1 通用爬虫和聚焦爬虫 根据使用场景,网络爬虫可分为 通用爬虫 和 聚焦爬虫 两种. 通用爬虫 通用网络爬虫 是 捜索引擎抓取系统(Baidu、Google、Yahoo等)的重要组成部分。主要目的是将互联网上的网页下载到本地,形成一个互联网内容的镜像备份。 通用搜索引

害!两小时带你看透数据可视化


一、数据可视化概述 1、什么是数据可视化 在计算机视觉领域,数据可视化是对数据的一种形象直观的解释,实现从不同维度观察数据,从而得到更有价值的信息。 抽象的、复杂的、不易理解的数据 图形、图像、符号、颜色、纹理等 具备较高的识别效率 数据本身所包含的有用信息 2、为什么要进行数据可视化 我们利用视觉

正则表达式(反正也记不住,用的时候查就行)


1、正则表达式概述 正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或RE),是计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列匹配某个句法规则的字符串。在很多文本编辑器里

机器学习难吗?那必然难啊!!!


机器学习 第一章数据挖掘 数据挖掘概念 数据挖掘一般是指从大量的数据中通过算法搜索隐藏于其中信息,从数据中发现有用的信息,从而帮助我们做出决策 数据挖掘做什么:1预测和描述数据,预测的计算机和事件过程被称为监督学习:从标记的训练数据来推断一个功能的机器学习任务 描述则被通常称为无监督学习:根据位置样

python数据清洗(numpy+pandas)


第一章:数据清洗常用工具 1.numpy常用数据结构 常用清洗工具: 目前在Python中, numpy和pandas是最主流的工具 Numpy中的向量化运算使得数据处理变得高效 Pandas提供了大量数据清洗的高效方法 在Python中,尽可能多的使用numpy和pandas中的 函数,提高数据清

jmeter压测服务器并监控各项指标

性能 

一、性能工具的安装部署 1、下载JMeterPlugins-Standard-1.4.0.zip的安装包 2、解压JMeterPlugins-Standard-1.4.0.zip,将其中\lib\ext\JMeterPlugins-Standard.jar包复制到jmeter安装目录下的\lib\e

python笔记

Python 

01-字符串+列表与元组 字符串的概念 字符串是 Python 中最常用的数据类型。我们可以使用引号来创建字符串。 str1='Hello' #单引号的字符串 str2="Hello" #双引号的字符串 str3='''Hello''' #三引号的字符串 字符串中本身有单引号时,外面用