只需 3 个简单步骤,用 Python 自动完成网页 PDF 转换?
您在浏览网页时可能会想:"我想保存这个页面。 保存时该怎么做?不能将网页转化为 PDF 文件吗? 如果你只说'看帖子',那你就不是 IT Playground 的特里了! webtopdf.com 只要知道如何操作,任何人都能做到,让我们跳出这些简单的东西,深入 Python 自动化编程的深层世界。
开始
其实,很多人对编程、编码等字眼过敏。事实上,源代码现在已经由人工智能服务完成,我们只需要知道如何拿去运行就可以了。最重要的是 关于自动化内容的想法我想是的。
事实上,即使使用 Allen、Litton、Claude 3 等人工智能服务,除非是简单的编码,否则还是要来来回回好几次。即使将人工智能生成的代码通过 VS Code 等程序运行,我想也需要 10-20% 左右才能一次性成功实现所需的功能。
好了,刚才的介绍太长了,让我们开始吧。
Python 自动化 代码源
# 파이썬 자동화 코드소스
from selenium import webdriver
from selenium.webdriver.common.keys import Keys
import time
# URL 목록 (필요에 따라서 원하는 만큼 목록 생성하기)
urls = ["https://namu.wiki/w/Python?from=%ED%8C%8C%EC%9D%B4%EC%8D%AC", "https://namu.wiki/w/Visual%20Studio%20Code?from=VS%20Code"]
# 각 URL에 대해 반복
for url in urls:
# Chrome 드라이버 설정
driver = webdriver.Chrome()
# webtopdf.com 페이지 열기
driver.get("https://webtopdf.com/")
# 페이지가 로드될 때까지 기다리기
time.sleep(1)
# 검색 상자 찾기 및 URL 입력
search_box = driver.find_element("name", "textfield")
search_box.clear()
search_box.send_keys(url)
# 변환 버튼 클릭
convert_button = driver.find_element("id", "btnConvert")
convert_button.click()
# 변환이 완료될 때까지 기다리기 (필요에 따라 시간(초) 조절)
time.sleep(30)
# 다운로드 버튼 클릭
download_button = driver.find_element("css selector", ".downfile_over")
download_button.click()
# pdf파일이 다운로드 완료될 때까지 기다리기 (필요에 따라 시간(초) 조절)
time.sleep(30)
# 브라우저 닫기
driver.quit()让我们从结果开始,我不知道你是否真的擅长提示并得到你想要的东西,但对大多数人来说,这说起来容易做起来难,所以让我们用我最终完成的源代码运行它。
如果你想深入了解,我希望你能继续学习这篇文章。 这比你想象的要有趣得多。 我以前在编码时会摇头,但现在我对人工智能感到兴奋。编码 + 人工智能,让人肾上腺素飙升)。
启动并运行源代码
首先,将上述源代码复制并粘贴到 VS Code 中,如下图所示。 如果没有安装 VS Code,可以使用 安装 VS CODE - Windows 帖子。查看源代码的第 6 行,你会看到一个 URL 列表。然后点击右上角的神奇按钮(运行按钮 ▷)。

然后,就像变魔术一样,你的电脑会自行启动 Chrome 浏览器,然后你就可以进入 "webtofeedf.com",输入你要保存的网址,并将页面下载为 pdf 文件。我稍后会发帖介绍,但即使是输入 "URL 列表 "插入也是一种真正的享受。
作为参考,本源代码中的 URL 列表是 TreeWiki 上的介绍页面。分别是关于 Python 和 VS Code 的。如果能很好地转换成 PDF 格式,值得一读。
需要考虑的事项
同时,'......输入网站地址'与'webtofeedf.com'搭配,使该网站以 pdf 文件的形式提供,即'webtofeedf.com'。转换时间",转换后的 PDF 文件为"......"。下载时间的设置。下载时间因网页的文字、图片等内容而异,但不知为何,我从未遇到过下载时间少于 30 秒的问题(有时下载时间超过 40 秒,但那是因为我公寓楼里的电信线路问题......)。
组织起来
我无意中成了 webtopdf 服务的广告,但既然他们免费提供无限制的服务,我认为他们应该做这项服务来谋生。 有许多网站限制 pdf 转换的数量。 我在这篇文章中创建了一个自动化系统,当你运行 Python 源代码时,它可以自动将网页创建为 pdf 文件。 我将以本文附录或新文章的形式谈论上述过程的流程原理。
今天我们讨论的内容有点深奥,但实施起来并不困难。 直到有一天,我们的生活会因为信息技术知识的增加而变得丰富多彩。 生活2.0:IT游乐场特里将继续运行。
谢谢。
附录。读取源代码的人工智能
下面的源代码和注释是尝试解释生成式人工智能的结果。 如果您正在阅读这篇文章,请尝试通过粘贴来解释上述源代码。与其要求详细的解释,不如尝试分配一个角色,然后说 "你现在是 Python 专家了。如果您有不明白的地方,请要求更详细的解释。 经过几步之后,您应该能够理解 50% 以上的内容。
####### 由 Claude.ai 赞助
这段代码通过网络自动化执行从给定的 URL 列表中将网页下载为 PDF 文件的功能。下面我们将逐步讲解代码。
# 필요한 라이브러리 및 모듈 임포트
from selenium import webdriver # 웹 브라우저 자동화를 위한 Selenium 라이브러리
from selenium.webdriver.common.keys import Keys # 키보드 입력을 자동화하기 위한 Keys 모듈
import time # 시간 지연을 위한 time 모듈
# URL 목록 선언 및 초기화
# 목록에 PDF로 변환하고자 하는 웹페이지 URL을 추가할 수 있음
urls = ["https://namu.wiki/w/Python?from=%ED%8C%8C%EC%9D%B4%EC%8D%AC",
"https://namu.wiki/w/Visual%20Studio%20Code?from=VS%20Code"]
# 각 URL에 대해 반복 처리
for url in urls:
# Chrome 웹 드라이버 실행
driver = webdriver.Chrome()
# webtopdf.com 페이지 열기
driver.get("https://webtopdf.com/")
# 페이지가 완전히 로드될 때까지 1초 대기
time.sleep(1)
# #1 웹페이지의 URL 입력 상자 찾기 및 URL 입력
search_box = driver.find_element("name", "textfield")
search_box.clear() # 입력상자 초기화
search_box.send_keys(url) # URL 입력
# #2 변환 버튼 클릭
convert_button = driver.find_element("id", "btnConvert")
convert_button.click()
# #3 변환 작업이 완료될 때까지 30초 대기
time.sleep(30)
# #4 다운로드 버튼 클릭
download_button = driver.find_element("css selector", ".downfile_over")
download_button.click()
# #5 PDF 파일 다운로드가 완료될 때까지 30초 대기
time.sleep(30)
# #6 Chrome 드라이버 종료
driver.quit()分步说明
- 找到网页的 URL 输入框并输入给定的 URL。
- 单击 "转换 "按钮,开始将网页转换为 PDF 文件。
- 等待 30 秒 PDF 转换完成。
- 转换完成后,单击 "下载 "按钮开始下载 PDF 文件。
- 等待 30 秒下载 PDF 文件。
- 一切完成后,退出 Chrome 浏览器驱动程序。
此代码使用循环将 URL 列表中的所有网页转换并下载为 PDF 文件。执行时间可能因网页大小和网速而异。我们对每个步骤都做了详细解释,即使是初学者也能理解。
'secondlife.lol'上的所有内容均受版权法保护。未经授权,禁止复制、拷贝、传播等。





