|

Google Collab 完整使用指南:开始使用 Cagle API 进行数据分析

您是否曾经想学习数据分析却不知从何下手?或者您是否想过:"我无法让 Python 在我的电脑上运行,我该怎么办?"如果是这样,今天的文章将让您大开眼界!我们将向您介绍 使用 Google Collab 和 Cagle API 分析数据指南给你

Korrab 是一个基于云的 Python 环境,初学者也能轻松使用,而 Cagle API 则是一个能让世界各地的数据专业人士直接访问他们最喜欢的数据集的工具。 本文结束时,你将自信地迈出数据分析的第一步!

如何使用 Google Collab:以下是开始使用的方法!

什么是 Google Collab?

구글 코랩 사용법 - 코랩 홈페이지 이미지

Google Colab是由谷歌提供的基于云的 Python 执行环境,让您无需安装任何设备即可运行 Python 代码,并可免费使用 GPU 和 TPU 等高性能硬件。 它还可以轻松与 Google Drive 集成,因此存储数据轻而易举!

如何使用 Collab:从基础开始!

구글 코랩 새노트 만들기 이미지
  1. 使用 Google 帐户登录
    • 首先,创建一个 Google Colab了解更多信息。它是免费的,任何拥有谷歌账户的人都可以使用。
  2. 创建新笔记本
    • 屏幕右下方 新笔记本电脑 按钮创建新的 Python 笔记本。
    • 现在您可以输入 Python 代码了!
  3. 运行 Python 代码
    • 在代码单元格中输入 print("Hello, Google Colab!")然后按下单元格左侧的运行按钮 (▶)。结果就会打印在屏幕上。
Hello, Google Colab 출력 이미지

为什么使用 Google Collab?

  • 无需安装:无需复杂配置,即可使用!
  • 高性能支持GPU/TPU:对于机器学习任务而言,GPU/TPU 的使用不成问题。
  • 免费:您可以免费试用高级工具。

Cagle API:从数据下载到分析,一步到位!

什么是 Caggle API?

Cagle 是数据分析竞赛的圣地。 它有大量的数据集和从分析基础到高级课程的各种学习资源。 但是,如果您不想每次都从网站上下载数据集,该怎么办呢? 试试 Cagle API。只需一行代码即可获取数据集!

캐글 API 사용 - 캐글 홈페이지 이미지

如何设置 Cagle API

  1. 创建 Cagle 帐户
    • Kaggle并创建一个账户。
  2. 下载 API 密钥
    • Kaggle 登录 > 右上角个人资料图片 > 设置 > API "创建新令牌" > 下载 kaggle.json 文件。
  3. 将您的 API 密钥上传到 Google Collab
    • 在科拉普 kaggle.json 上传文件(单击①图标打开上传窗口,上传 JSON 文件后会出现上传历史记录,如图②所示)。
구글 코랩에 API 키 업로드
!pip install kaggle # 安装 kaggle 库
导入 os
os.environ['KAGGLE_CONFIG_DIR'] = '/content' 设置 # API 密钥存储路径
!chmod 600 /content/kaggle.json # 安全设置
캐글 라이브러리 설치

Cagle 数据下载代码示例

下载 # Kaggle 数据集
!kaggle datasets download -d khsamaha/aviation-accident-database-synopses -p /content/aviation_data --unzip
  • 上述代码相当于 飞机事故数据集例如 -d是数据集 ID、 -p是保存路径。
캐글 데이터 다운로드 코드 예시

使用 Google 的 Korab 和 Cagle API 开始分析数据

既然已经下载了数据,那就开始分析吧。下面是检查数据的简单代码。

import pandas as pd

加载 # 数据
file_path = '/content/aviation_data/AviationData.csv' 文件路径
df = pd.read_csv(file_path, encoding='ISO-8859-1')

检查 # 数据
print(df.head())
구글 코랩과 캐글 API로 데이터 분석 시작하기

回顾:使用 Google Corlab 和 Cagle API 进行数据分析的第一步!

今天 如何使用 Google Collab卡格尔应用程序接口Korab 和 Cagle 是数据分析初学者的理想工具,不妨一试,发现隐藏在数据中的有趣模式。 下一篇数据分析之旅再见!

#Python 代码详情

我们将逐行指导您使用 Cagle API 下载和分析数据。

!pip install kaggle # 安装 kaggle 库

该命令在 Google Collab 环境中安装 Cagle 库,"!"用于在 Collab 中运行系统命令。

导入 os

导入操作系统模块。该模块提供与操作系统交互的功能[2]。

os.environ['KAGGLE_CONFIG_DIR'] = '/content' 设置存储 # API 密钥的路径

指定 Cagle API 密钥文件的位置,其中"/content "是 Korab 的默认工作目录。

!chmod 600 /content/kaggle.json # 安全设置

更改 kaggle.json 文件的权限。600 是一种权限设置,只允许所有者读写。

下载 # Kaggle 数据集
!kaggle datasets download -d khsamaha/aviation-accident-database-synopses -p /content/aviation_data --unzip

该命令下载并解压指定的 cagle 数据集。

import pandas as pd

导入 pandas 库。该库对分析数据非常有用。

加载 # 数据
file_path = '/content/aviation_data/AviationData.csv' 文件路径
df = pd.read_csv(file_path, encoding='ISO-8859-1')

将下载的 CSV 文件读入 pandas DataFrame。 编码 "参数指定文件的编码方式。

检查 # 数据
print(df.head())

输出 DataFrame 的前五行。这样就可以快速查看数据结构

类似文章