如何使用Python构建打字机器人,以及进行Web抓取

众所周知,Python作为编程语言的一种,不仅语法简单、易学并且很有前途,很多人都对Python感兴趣。Python的应用十分广泛。经常关注我的朋友可能知道,关于Python的使用,之前已经为大家介绍了很多用法,今天主要介绍两个方面的内容,一个是如何使用Python构建打字机器人,另一是如何使用Python进行Web抓取的内容。

如何使用Python构建打字机器人,以及进行Web抓取_人工智能_机器人

 一、如何使用Python构建打字机器人

先决条件

pip install selenium

代码段

# Importing required modules and initializing variablesfrom selenium import webdriverfrom selenium.webdriver.common.action_chains import ActionChainsimport re

string = ''

# ______________________________________

# Opening thetypingcat.com on firefox

firefox = webdriver.Firefox()

firefox.get

# ______________________________________

# Using javascript to get the typing content from the website and storing value in "string" variablefor i in range(firefox.execute_script('return document.querySelectorAll(".line").length')):

string += firefox.execute_script('return document.querySelectorAll(".line")['+str(i)+'].innerHTML')

string = re.sub(r'<[^>]*>','',string) #This line is just delete tags present inside string

# ______________________________________

# Selenium commands to type what is stored inside string variable on the focused screen

action = ActionChains(firefox)

action.send_keys(string)

action.perform()

# ______________________________________ END ______________________________________

 二、如何使用Python进行Web抓取

仅需9行代码即可使用Python进行Web抓取。

先决条件

如果还没有安装,请安装beautifulsoup4和请求。

pip install beautifulsoup4

pip install requests

代码段

import requestsfrom bs4 import BeautifulSoup

result = requests.get

soup = BeautifulSoup(result.content)

links = soup.find_all("a", "title")

data = {}for link in links:

title = link.string

data[title] = link.attrs['href']

这里是完整的代码段,您可以将其直接复制并粘贴到终端,收藏的文本编辑器或jupyter笔记本中。

要检查您是否正确执行了该操作,数据输出应类似于以下内容:

{'MSI GL62VR 7RFX': '/test-sites/e-commerce/allinone/product/326',

'Dell Vostro 15…': '/test-sites/e-commerce/allinone/product/283',

'Dell Inspiron 17…': '/test-sites/e-commerce/allinone/product/296'}

Web抓取功能很棒,当您想从网站中快速提取数据时,可以节省大量时间。上面的示例可帮助您快速入门。

好了以上就是关于如何使用Python构建打字机器人,以及进行Web抓取的全部内容介绍,想了解更多关于Python的信息,请继续关注。

13
124
0
62

相关资讯

  1. 1、​振动传感器如何选型?4051
  2. 2、腾讯云发布企业级数据库迁移产品DBbridge,业务数据量达到200G3749
  3. 3、区块链能否为道德钻石行业铺平道路?3532
  4. 4、新加坡国立大学研发出新型电子皮肤可自我修复、可拉伸、触敏!4600
  5. 5、李嘉诚通过基金会以3000万美元投资小米,首日公开认购表现平淡2426
  6. 6、PID传感器在化工生产中的VOCs泄漏检测2357
  7. 7、​新型空气传感器能使化工厂更安全1757
  8. 8、比特大陆正式发布第二代7nm芯片,支持SHA256算法2920
  9. 9、聊天机器人创企LeenaAI获200万美元的种子轮融资!2003
  10. 10、激光雷达市场规模有望突破200亿元3907
全部评论(0)
我也有话说
0
收藏
点赞
顶部