博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
使用pandas读取数据并统计论文数据(2)2021-01-17
阅读量:3949 次
发布时间:2019-05-24

本文共 1142 字,大约阅读时间需要 3 分钟。

datawhale数据分析task1(2)使用pandas读取数据并统计论文数据

1、python datetime处理时间

1.1获取指定的时间和日期。

datetime(%Y,%m,%d,%H,%M,%S)

datetime共有6个参数,分别代表的是年月日时分秒。其中年月日是必须要传入的参数,时分秒可以不传入,默认全为零。

datatime(2017,9,24)
Out:datatime.datatime(2017,9,24,0,0)

1.2将Str和Unicode转化为datetime。

datetime(str,format)

很多情况下,原始数据中的时间和日期并不是时间类型的,如excel中可能是Unicode,csv中可能是Str。因此我们在进行时间切片之前首先要将非时间类型的时间数据转换为时间类型。

2、爬虫需要的HTML基础

最基本的标签说明

标签基本格式:
<标签名 属性名1="属性值" 属性名2="属性值" ...>
文档内容
: 用于代码开头指定html版本等信息;: 告知浏览器这是一个HTML文档,是HTML文档中最外层的元素;: 所有头部元素的容器,必须包含文档的标题(title),可以包含脚本、样式、meta信息以及其他;: 定义文档的标题,定义浏览器工具栏中的标题,显示在搜索引擎结果中的页面标题;: 定义文档的主体,包含文档的所有内容(比如文本、超链接、图像、表格和列表等);

: 定义HTML标题,从

标题的重要程度逐渐降低;

: 定义段落,浏览器会自动在其前后创建一些空白;
: 一个简单的换行符,是一个空标签,意味着它没有结束标签;
:定义HTML文档中的一个分隔区块或者一个区域部分,经常与CSS一起使用,用来布局网页。**链接中一些常用的标签**标签实现基本的超链接访问DC官网其中为标签,href=http://www.pkbigdata表示链接指向的地址,访问DC官网表示超链接的文本指向同一服务器同一目录下的form.htmlFill Our Form指向同一服务器父目录下的parent.htmlParent指向同一服务器子目录下的stuff下的cat.htmlCatalog指向外部网站 (会在新的标签页打开)BASD

链接中一些常用的标签

标签实现基本的超链接访问DC官网其中为标签,href=http://www.pkbigdata表示链接指向的地址,访问DC官网表示超链接的文本指向同一服务器同一目录下的form.htmlFill Our Form指向同一服务器父目录下的parent.htmlParent指向同一服务器子目录下的stuff下的cat.htmlCatalog指向外部网站 (会在新的标签页打开)BASD

3、正则表达式

转载地址:http://dagwi.baihongyu.com/

你可能感兴趣的文章
MongoDB基本使用
查看>>
mongodb管理与安全认证
查看>>
nodejs内存控制
查看>>
nodejs Stream使用中的陷阱
查看>>
MongoDB 数据文件备份与恢复
查看>>
数据库索引介绍及使用
查看>>
MongoDB数据库插入、更新和删除操作详解
查看>>
MongoDB文档(Document)全局唯一ID的设计思路
查看>>
mongoDB简介
查看>>
Redis持久化存储(AOF与RDB两种模式)
查看>>
memcached工作原理与优化建议
查看>>
Redis与Memcached的区别
查看>>
redis sharding方案
查看>>
程序员最核心的竞争力是什么?
查看>>
Node.js机制及原理理解初步
查看>>
linux CPU个数查看
查看>>
分布式应用开发相关的面试题收集
查看>>
简单理解Socket及TCP/IP、Http、Socket的区别
查看>>
利用HTTP Cache来优化网站
查看>>
利用负载均衡优化和加速HTTP应用
查看>>