博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
使用pandas读取数据并统计论文数据(2)2021-01-17
阅读量:3949 次
发布时间:2019-05-24

本文共 1142 字,大约阅读时间需要 3 分钟。

datawhale数据分析task1(2)使用pandas读取数据并统计论文数据

1、python datetime处理时间

1.1获取指定的时间和日期。

datetime(%Y,%m,%d,%H,%M,%S)

datetime共有6个参数,分别代表的是年月日时分秒。其中年月日是必须要传入的参数,时分秒可以不传入,默认全为零。

datatime(2017,9,24)
Out:datatime.datatime(2017,9,24,0,0)

1.2将Str和Unicode转化为datetime。

datetime(str,format)

很多情况下,原始数据中的时间和日期并不是时间类型的,如excel中可能是Unicode,csv中可能是Str。因此我们在进行时间切片之前首先要将非时间类型的时间数据转换为时间类型。

2、爬虫需要的HTML基础

最基本的标签说明

标签基本格式:
<标签名 属性名1="属性值" 属性名2="属性值" ...>
文档内容
: 用于代码开头指定html版本等信息;: 告知浏览器这是一个HTML文档,是HTML文档中最外层的元素;: 所有头部元素的容器,必须包含文档的标题(title),可以包含脚本、样式、meta信息以及其他;: 定义文档的标题,定义浏览器工具栏中的标题,显示在搜索引擎结果中的页面标题;: 定义文档的主体,包含文档的所有内容(比如文本、超链接、图像、表格和列表等);

: 定义HTML标题,从

标题的重要程度逐渐降低;

: 定义段落,浏览器会自动在其前后创建一些空白;
: 一个简单的换行符,是一个空标签,意味着它没有结束标签;
:定义HTML文档中的一个分隔区块或者一个区域部分,经常与CSS一起使用,用来布局网页。**链接中一些常用的标签**标签实现基本的超链接访问DC官网其中为标签,href=http://www.pkbigdata表示链接指向的地址,访问DC官网表示超链接的文本指向同一服务器同一目录下的form.htmlFill Our Form指向同一服务器父目录下的parent.htmlParent指向同一服务器子目录下的stuff下的cat.htmlCatalog指向外部网站 (会在新的标签页打开)BASD

链接中一些常用的标签

标签实现基本的超链接访问DC官网其中为标签,href=http://www.pkbigdata表示链接指向的地址,访问DC官网表示超链接的文本指向同一服务器同一目录下的form.htmlFill Our Form指向同一服务器父目录下的parent.htmlParent指向同一服务器子目录下的stuff下的cat.htmlCatalog指向外部网站 (会在新的标签页打开)BASD

3、正则表达式

转载地址:http://dagwi.baihongyu.com/

你可能感兴趣的文章
iOS QQ侧滑菜单(高仿)
查看>>
iOS 扫一扫功能开发
查看>>
iOS app之间的跳转以及传参数
查看>>
iOS __block和__weak的区别
查看>>
Android(三)数据存储之XML解析技术
查看>>
Spring JTA应用之JOTM配置
查看>>
spring JdbcTemplate 的若干问题
查看>>
Servlet和JSP的线程安全问题
查看>>
GBK编码下jQuery Ajax中文乱码终极暴力解决方案
查看>>
Oracle 物化视图
查看>>
PHP那点小事--三元运算符
查看>>
解决国内NPM安装依赖速度慢问题
查看>>
Brackets安装及常用插件安装
查看>>
Centos 7(Linux)环境下安装PHP(编译添加)相应动态扩展模块so(以openssl.so为例)
查看>>
fastcgi_param 详解
查看>>
Nginx配置文件(nginx.conf)配置详解
查看>>
标记一下
查看>>
IP报文格式学习笔记
查看>>
autohotkey快捷键显示隐藏文件和文件扩展名
查看>>
Linux中的进程
查看>>