python操作谷歌浏览器 python操作谷歌浏览器无痕打开

大家好,今天来为大家分享python操作谷歌浏览器的一些知识点,和python操作谷歌浏览器无痕打开的问题解析,大家要是都明白,那么可以忽略,如果不太清楚的话可以看看本篇文章,相信很大概率可以解决您的问题,接下来我们就一起来看看吧!

python操作谷歌浏览器 python操作谷歌浏览器无痕打开

本文目录

  1. 如何用声音来操控IE浏览器及语音识别引擎的使用
  2. 如何用Python抓取动态页面信息
  3. python本地配置Google Earth Engine
  4. ...操作浏览器登录微博后,怎么抓取数据,Python语言

一、如何用声音来操控IE浏览器及语音识别引擎的使用

最近做字幕的时候发现一个通过声音控制IE浏览器的方法。本来是要制作字幕的,后来想想如果纯手工制作字幕的话那么效率肯定非常低,做为程序员,本能的想到了让计算机来帮忙。做字幕就是从声音识别出文字,然后在校对时间轴。很机械化的操作,非常适合计算机的来做。通过搜索很快找到了解决方案。使用Microsoft Speech SDK+Python+PythonWin。虽然微软的语音识别引擎已经很强大了,但是要用它来制作字幕还有很长的路要走。字幕做不成了,不过用它来操控浏览器还是错错有余的。发现使用语音功能操作IE浏览器还是非常方便,只要设置好语句,IE浏览器就可以自动进行相关的操作。

下面是我已经实现的一些功能。(=符号前面是你要说的话,后面是浏览器执行的操作)

“显示浏览器”=打开浏览器,“谷歌”=进入谷歌的页面,“百度”=进入百度的页面,“优酷”=进入优酷的页面等等,“后退”=返回上一个页面,“最大化”=最大化浏览器,“下拉”=下拉网页,“上拉”=上拉网页,“放大”=放大网页,“缩小”=缩小网页,“关闭浏览器”=关闭浏览器。

1.从微软官网下载SpeechSDK51.exe和SpeechSDK51LangPack.exe

   2.下载Python2.6+PythonWin+wxPython和启动语音识别的脚本文件。从这里打包下载。

3.安装SpeechSDK51.exe,SpeechSDK51LangPack.exe

4.安装Python2.6,PythonWin,wxPython

5.运行开始菜单-所有程序-Python2.6— PythonWin,选择Tools- COM MakePy utility- Microsoft Speech Object Library 5.0

6.在控制面板的语音里面,在语言里选Microsoft Simplified Chinese Recognizer,在语音选择里选Microsoft Simplified Chinese

   环境搭建完成,运行SpeechGui.py脚本就可以来用声音操控浏览器。不过由于Python+PythonWin的强大威力,不单单只有IE浏览器可以进行该操作,只要软件能够支持com的应用就都可以显示语音操控,比如微软的Windows Media Player,Word,Excel等软件。强烈建议大家自己手动去发掘和制作更多有意思的功能。

二、如何用Python抓取动态页面信息

有一个思路最为简单的思路可以动态解析页面信息。urllib不可以解析动态信息,但是浏览器可以。在浏览器上展现处理的信息其实是处理好的HTML文

档。这为我们抓取动态页面信息提供了很好的思路。在Python中有一个很有名的图形库——PyQt。PyQt虽然是图形库,但是他里面

QtWebkit。这个很实用。谷歌的Chrome和苹果的Safari都是基于WebKit内核开发的,所以我们可以通过PyQt中得QtWebKit

把页面中的信息读取加载到HTML文档中,再解析HTML文档,从HTML文档中提取我们想用得信息。

作者本人实用Mac OS X。应该在Windows和Linux平台也可以采用相同的办法。

Library,而不是Creator。Library在Mac的默认安装路径下,应该是/home/username/Developor/,不要改变Qt4的默认安装路径。否则可能安装失败。

官方网址:

这两个软件可以在在PyQt的官网找到。下载的是它的源码。Mac和Linux需要自己编译。

下载地址是:

在终端切换到文件解压后的目录中。

SIP和PyQt4两个安装方法相同。但是PyQt4依赖SIP。所以先安装SIP再安装PyQt4

1、2两步完成之后,Python的PyQt4的模块就安装好了。在Python shell中输入import PyQt4看看能不能找到PyQt4的模块。

spynner是一个QtWebKit的客户端,它可以模拟浏览器,完成加载页面、引发事件、填写表单等操作。

这个模块可以在Python的官网找到。

下载地址:

解压后,cd到安装目录,然后输入sudo python configure.py install安装该模块。

这样Spynner模块就安装完成了,在python shell中试试import spynner看看该模块有没有安装完成。

Spynner的功能十分强大,但是由于本人能力有限,就介绍一下如何显示网页的源码吧。

browser.load("")

#browser类中有一个类方法load,可以用webkit加载你想加载的页面信息。

#load(是你想要加载的网址的字符串形式)

print browser.html.encode("utf-8")

#browser类中有一个成员是html,是页面进过处理后的源码的字符串.

open("Test.html",'w+').write(browser.html.encode("utf-8"))

#你也可以将它写到文件中,用浏览器打开。

通过这个程序,就可以比较容易的显示webkit处理的页面HTML源码了。

下面介绍一下spynner的简单应用,通过简单的程序,可以获取你在浏览器中看到的页面的全部图片。用HTMLParser、BeautifulSoup等都可以完成HTMLParser文档的解析。而我选择HTMParser。

class MyParser(HTMLParser.HTMLParser):

def handle_starttag(self, tag, attrs):

url= dict(attrs)['src']

name= os.path.basename(dict(attrs)['src'])

if name.endswith('.jpg') or name.endswith('.png') or name.endswith('gif'):

urllib.urlretrieve(url, name)

browser.load("")

通过这个程序,可以下载你在页面上看到的全部图片。简单的几行程序就完成了这个艰巨的任务。实现了图片的批量处理。这真是Python语言的优势,再艰巨的任务交给第三方吧。

三、python本地配置Google Earth Engine

1、在配置Google Earth Engine(GEE)的本地环境时,可能会出现一些常见的问题。下面是一些建议来解决你遇到的问题:

2、代理设置:如果你使用了代理,可能会导致登录验证失败。可以尝试关闭代理并重新运行"earthengine authenticate"命令,看看是否能够成功验证。

3、浏览器设置:确保你使用的浏览器没有被设置为自动使用代理。有时候,浏览器的代理设置会干扰 GEE的账户验证过程。你可以在浏览器设置中检查这一点,并将其设置为“不使用代理”。

4、账户权限:检查一下你的 Google账户是否具有访问 Earth Engine的权限。确保你已经正确订阅了 Google Earth Engine并拥有合适的许可证。

5、安全软件与防火墙:在某些情况下,安全软件或防火墙可能会干扰 GEE的网络连接。你可以尝试暂时关闭它们,并重新进行账户验证。

6、更新 Earth Engine Python库:确保你使用的是最新版本的 Earth Engine Python库。你可以通过 pip来更新该库:

7、如果你仍然遇到问题,建议向 Google Earth Engine官方论坛或帮助中心寻求支持和解决方案,他们会更了解特定的技术细节,并提供更具体的帮助。

四、...操作浏览器登录微博后,怎么抓取数据,Python语言

1、用户在新浪微博给的页面输入账号密码,然后微博给应用一个PIN码,这样应用通过PIN码才有权限访问该用户的信息,而应用在整个过程中是接触不到密码的,所以用户觉得很安全,后果很满意

2、2:获得认证之后,就可以使用微博SDK提供的API获得信息啦

3、3:如果想设计web或者客户端应用的话,那就继续加个GUI好啦(未完成)

4、from weibopy.auth import OAuthHandler

5、AppSecret='2e2c7bcdfc362eace266d1f2bf83fe6b'

6、my_auth= OAuthHandler(AppKey, AppSecret)

7、webbrowser.open(my_auth.get_authorization_url())

8、verifier= raw_input('PIN:').strip()

9、my_auth.get_access_token(verifier)

10、for comment in my_api.mentions():

11、 id= object.__getattribute__("id")

12、 text= object.__getattribute__("text")

python操作谷歌浏览器和python操作谷歌浏览器无痕打开的问题分享结束啦,以上的文章解决了您的问题吗?欢迎您下次再来哦!

声明:信息资讯网所有作品(图文、音视频)均由用户自行上传分享,仅供网友学习交流,版权归原作者东方体育日报所有。若您的权利被侵害,请联系 删除。

本文链接:http://www.gdxhedu.com/news/142649.html