如何使用Python构建打字机器人,以及进行Web抓取

众所周知,Python作为编程语言的一种,不仅语法简单、易学并且很有前途,很多人都对Python感兴趣。Python的应用十分广泛。经常关注我的朋友可能知道,关于Python的使用,之前已经为大家介绍了很多用法,今天主要介绍两个方面的内容,一个是如何使用Python构建打字机器人,另一是如何使用Python进行Web抓取的内容。

如何使用Python构建打字机器人,以及进行Web抓取_人工智能_机器人

 一、如何使用Python构建打字机器人

先决条件

pip install selenium

代码段

# Importing required modules and initializing variablesfrom selenium import webdriverfrom selenium.webdriver.common.action_chains import ActionChainsimport re

string = ''

# ______________________________________

# Opening thetypingcat.com on firefox

firefox = webdriver.Firefox()

firefox.get

# ______________________________________

# Using javascript to get the typing content from the website and storing value in "string" variablefor i in range(firefox.execute_script('return document.querySelectorAll(".line").length')):

string += firefox.execute_script('return document.querySelectorAll(".line")['+str(i)+'].innerHTML')

string = re.sub(r'<[^>]*>','',string) #This line is just delete tags present inside string

# ______________________________________

# Selenium commands to type what is stored inside string variable on the focused screen

action = ActionChains(firefox)

action.send_keys(string)

action.perform()

# ______________________________________ END ______________________________________

 二、如何使用Python进行Web抓取

仅需9行代码即可使用Python进行Web抓取。

先决条件

如果还没有安装,请安装beautifulsoup4和请求。

pip install beautifulsoup4

pip install requests

代码段

import requestsfrom bs4 import BeautifulSoup

result = requests.get

soup = BeautifulSoup(result.content)

links = soup.find_all("a", "title")

data = {}for link in links:

title = link.string

data[title] = link.attrs['href']

这里是完整的代码段,您可以将其直接复制并粘贴到终端,收藏的文本编辑器或jupyter笔记本中。

要检查您是否正确执行了该操作,数据输出应类似于以下内容:

{'MSI GL62VR 7RFX': '/test-sites/e-commerce/allinone/product/326',

'Dell Vostro 15…': '/test-sites/e-commerce/allinone/product/283',

'Dell Inspiron 17…': '/test-sites/e-commerce/allinone/product/296'}

Web抓取功能很棒,当您想从网站中快速提取数据时,可以节省大量时间。上面的示例可帮助您快速入门。

好了以上就是关于如何使用Python构建打字机器人,以及进行Web抓取的全部内容介绍,想了解更多关于Python的信息,请继续关注。

13
124
0
62

相关资讯

  1. 1、英伟达发布基于AI的区块链式的计算平台,可保护患者隐私991
  2. 2、三星积极布局AI,欲挑战谷歌和亚马逊地位?3461
  3. 3、​无线采集数据终端应用带动出入库管理发展2386
  4. 4、特朗普拟限制中国技术投资4463
  5. 5、剥线机在汽车线束领域的应用4018
  6. 6、谢旭辉:知识产权是人工智能产业的一种基础设施3005
  7. 7、人工智能技术正在加速商业化!2176
  8. 8、AR眼镜初创公司North收购英特尔230份Vaunt专利3991
  9. 9、第九届吴文俊人工智能科学技术奖获奖名单公布,云知声等12家公司入选1231
  10. 10、号称未来通讯的5G,能给半导体厂商带来哪些机遇1590
全部评论(0)
我也有话说
0
收藏
点赞
顶部