如何使用Python构建打字机器人,以及进行Web抓取

众所周知,Python作为编程语言的一种,不仅语法简单、易学并且很有前途,很多人都对Python感兴趣。Python的应用十分广泛。经常关注我的朋友可能知道,关于Python的使用,之前已经为大家介绍了很多用法,今天主要介绍两个方面的内容,一个是如何使用Python构建打字机器人,另一是如何使用Python进行Web抓取的内容。

如何使用Python构建打字机器人,以及进行Web抓取_人工智能_机器人

 一、如何使用Python构建打字机器人

先决条件

pip install selenium

代码段

# Importing required modules and initializing variablesfrom selenium import webdriverfrom selenium.webdriver.common.action_chains import ActionChainsimport re

string = ''

# ______________________________________

# Opening thetypingcat.com on firefox

firefox = webdriver.Firefox()

firefox.get

# ______________________________________

# Using javascript to get the typing content from the website and storing value in "string" variablefor i in range(firefox.execute_script('return document.querySelectorAll(".line").length')):

string += firefox.execute_script('return document.querySelectorAll(".line")['+str(i)+'].innerHTML')

string = re.sub(r'<[^>]*>','',string) #This line is just delete tags present inside string

# ______________________________________

# Selenium commands to type what is stored inside string variable on the focused screen

action = ActionChains(firefox)

action.send_keys(string)

action.perform()

# ______________________________________ END ______________________________________

 二、如何使用Python进行Web抓取

仅需9行代码即可使用Python进行Web抓取。

先决条件

如果还没有安装,请安装beautifulsoup4和请求。

pip install beautifulsoup4

pip install requests

代码段

import requestsfrom bs4 import BeautifulSoup

result = requests.get

soup = BeautifulSoup(result.content)

links = soup.find_all("a", "title")

data = {}for link in links:

title = link.string

data[title] = link.attrs['href']

这里是完整的代码段,您可以将其直接复制并粘贴到终端,收藏的文本编辑器或jupyter笔记本中。

要检查您是否正确执行了该操作,数据输出应类似于以下内容:

{'MSI GL62VR 7RFX': '/test-sites/e-commerce/allinone/product/326',

'Dell Vostro 15…': '/test-sites/e-commerce/allinone/product/283',

'Dell Inspiron 17…': '/test-sites/e-commerce/allinone/product/296'}

Web抓取功能很棒,当您想从网站中快速提取数据时,可以节省大量时间。上面的示例可帮助您快速入门。

好了以上就是关于如何使用Python构建打字机器人,以及进行Web抓取的全部内容介绍,想了解更多关于Python的信息,请继续关注。

13
124
0
62

相关资讯

  1. 1、采用嵌入式WEB服务器技术实现铁路分布式监控管理系统的设计507
  2. 2、LGCEO:不会退出智能手机业务,机器人业务两年内盈亏平衡462
  3. 3、从双十一到黑五,它引领了全球服务机器人市场4318
  4. 4、如何通过参数来判断手机屏幕的好坏4604
  5. 5、工业以太网的OPC通信服务3536
  6. 6、哪些工艺和机器人在手机智造领域最受关注?1114
  7. 7、富士康要强制休假4个月?回复来了!613
  8. 8、振动传感器的类型有哪些1923
  9. 9、特斯拉和大众从对手到盟友?2725
  10. 10、建材|工信部:2018年平板玻璃行业运行平稳4472
全部评论(0)
我也有话说
0
收藏
点赞
顶部