Python 中的 Youtube 数据 API nextPageToken 循环

2024-03-19

我根据在网上找到的许多不同示例将其拼凑在一起。

目标是：

在 youtube api 中搜索
将多个页面的搜索结果转换为 csv 文件

编辑：由于提供的答案之一，这是搜索循环的工作示例。现在按预期循环了最大次数 (10)，但是执行时的问题是CSV file

似乎在调用response之后，即使调用了results and writeCSV after.

任何进一步的帮助将不胜感激！

from googleapiclient.discovery import build
from googleapiclient.errors import HttpError
import argparse

DEVELOPER_KEY = "dev-key"
YOUTUBE_API_SERVICE_NAME = "youtube"
YOUTUBE_API_VERSION = "v3"

youtube = build(YOUTUBE_API_SERVICE_NAME, YOUTUBE_API_VERSION, developerKey=DEVELOPER_KEY)


# -------------Build YouTube Search------------#
def youtubeSearch(query, order="relevance"):
    # search 50 results per page
    request = youtube.search().list(
        q=query,
        type="video",
        order=order,
        part="id,snippet",
        maxResults="50",
        relevanceLanguage='en',
        videoDuration='long',
        fields='nextPageToken, items(id,snippet)'
    )

    title = []
    channelId = []
    channelTitle = []
    categoryId = []
    videoId = []
    viewCount = []
    likeCount = []
    dislikeCount = []
    commentCount = []
    favoriteCount = []
    tags = []
    category = []
    videos = []

    while request:
        response = request.execute()
        for search_result in response.get("items", []):
            if search_result["id"]["kind"] == "youtube#video":

                # append title and video for each item
                title.append(search_result['snippet']['title'])
                videoId.append(search_result['id']['videoId'])

                # then collect stats on each video using videoId
                stats = youtube.videos().list(
                    part='statistics, snippet',
                    id=search_result['id']['videoId']).execute()

                channelId.append(stats['items'][0]['snippet']['channelId'])
                channelTitle.append(stats['items'][0]['snippet']['channelTitle'])
                categoryId.append(stats['items'][0]['snippet']['categoryId'])
                favoriteCount.append(stats['items'][0]['statistics']['favoriteCount'])
                viewCount.append(stats['items'][0]['statistics']['viewCount'])

                # Not every video has likes/dislikes enabled so they won't appear in JSON response
                try:
                    likeCount.append(stats['items'][0]['statistics']['likeCount'])
                except:
                    # Good to be aware of Channels that turn off their Likes
                    print("Video titled {0}, on Channel {1} Likes Count is not available".format(
                        stats['items'][0]['snippet']['title'],
                        stats['items'][0]['snippet']['channelTitle']))
                    print(stats['items'][0]['statistics'].keys())
                    # Appends "Not Available" to keep dictionary values aligned
                    likeCount.append("Not available")

                try:
                    dislikeCount.append(stats['items'][0]['statistics']['dislikeCount'])
                except:
                    # Good to be aware of Channels that turn off their Likes
                    print("Video titled {0}, on Channel {1} Dislikes Count is not available".format(
                        stats['items'][0]['snippet']['title'],
                        stats['items'][0]['snippet']['channelTitle']))
                    print(stats['items'][0]['statistics'].keys())
                    dislikeCount.append("Not available")

                # Sometimes comments are disabled so if they exist append, if not append nothing...
                # It's not uncommon to disable comments, so no need to wrap in try and except
                if 'commentCount' in stats['items'][0]['statistics'].keys():
                    commentCount.append(stats['items'][0]['statistics']['commentCount'])
                else:
                    commentCount.append(0)

                if 'tags' in stats['items'][0]['snippet'].keys():
                    tags.append(stats['items'][0]['snippet']['tags'])
                else:
                    # I'm not a fan of empty fields
                    tags.append("No Tags")
        request = youtube.search().list_next(
            request, response)
    # Break out of for-loop and if statement and store lists of values in dictionary
    youtube_dict = {'tags': tags, 'channelId': channelId, 'channelTitle': channelTitle,
                    'categoryId': categoryId, 'title': title, 'videoId': videoId,
                    'viewCount': viewCount, 'likeCount': likeCount, 'dislikeCount': dislikeCount,
                    'commentCount': commentCount, 'favoriteCount': favoriteCount}


    print("Search Completed...")
    print("Total results: {0} \nResults per page: {1}".format(request['pageInfo']['totalResults'],
                                                              request['pageInfo']['resultsPerPage']))
    print("Example output per item, snippet")
    print(request['items'][0]['snippet'].keys())
    # Assign first page of results (items) to item variable
    items = request['items']  # 50 "items"

    # Assign 1st results to title, channelId, datePublished then print
    title = items[0]['snippet']['title']
    channelId = items[0]['snippet']['channelId']
    datePublished = items[0]['snippet']['publishedAt']
    print("First result is: \n Title: {0} \n Channel ID: {1} \n Published on: {2}".format(title, channelId,
                                                                                          datePublished))
    return youtube_dict


# Input query
print("Please input your search query")
q = input()
# Run YouTube Search
results = youtubeSearch(q)
# Display result titles
print("Top 3 results are: \n {0}, ({1}), \n {2}, ({3}),\n {4}, ({5})".format(results['title'][0],
                                                                             results['channelTitle'][0],
                                                                             results['title'][1],
                                                                             results['channelTitle'][1],
                                                                             results['title'][2],
                                                                             results['channelTitle'][2]))

# -------------------------Save results------------------------------#
print("Input filename to store csv file")
file = "\\YouTube\\" + input() + ".csv"


def writeCSV(results, filename):
    import csv
    keys = sorted(results.keys())
    with open(filename, "w", newline="", encoding="utf-8") as output:
        writer = csv.writer(output, delimiter=",")
        writer.writerow(keys)
        writer.writerows(zip(*[results[key] for key in keys]))


writeCSV(results, file)
print("CSV file has been uploaded at: " + str(file))

由于您使用的是 GooglePython 的 API 客户端库 https://github.com/googleapis/google-api-python-client, the 蟒蛇式的方式 https://googleapis.github.io/google-api-python-client/docs/pagination.html实施的结果集分页 https://developers.google.com/youtube/v3/guides/implementation/pagination on the Search.list https://developers.google.com/youtube/v3/docs/search/listAPI 端点如下所示：

request = youtube.search().list(
    q = 'A query',
    part = 'id,snippet',
    type = 'video',
    maxResults = 50,
    relevanceLanguage = 'en',
    videoDuration = 'long'
)

while request:
    response = request.execute()

    for item in response['items']:
        ...

    request = youtube.search().list_next(
        request, response)

由于 Python 客户端库的实现方式，它是如此简单：无需显式处理 API 响应对象的属性nextPageToken https://developers.google.com/youtube/v3/docs/search/list#nextPageToken以及API请求参数pageToken at all.

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python 中的 Youtube 数据 API nextPageToken 循环的相关文章

将 transaction.commit_manually() 升级到 Django > 1.6

我继承了为 Django 1 4 编写的应用程序的一些代码我们需要更新代码库以使用 Django 1 7 并最终更新到 1 8 作为下一个长期支持版本在一些地方它使用旧风格 transaction commit manually and
如何使用 colorchecker 在 opencv 中进行颜色校准？

我有数码相机获取的色彩检查器图像我如何使用它来使用 opencv 校准图像按照以下颜色检查器图像操作您是想问如何进行颜色校准或如何使用 OpenCV 进行校准为了进行颜色校准您可以使用校准板的最后一行灰色调以下是您应该逐步进行
ctypes 错误：libdc1394 错误：无法初始化 libdc1394

我正在尝试将程序编译为共享库我可以使用 ctypes 在 Python 代码中使用该库使用以下命令该库可以正常编译 g shared Wl soname mylib O3 o mylib so fPIC files pkg config
在 python 3 中使用子进程

我使用 subprocess 模块在 python 3 中运行 shell 命令这是我的代码 import subprocess filename somename py in practical i m using a real fil
从 Python 下载/安装 Windows 更新

我正在编写一个脚本来自动安装 Windows 更新我可以将其部署在多台计算机上这样我就不必担心手动更新它们我想用 Python 编写这个但找不到任何关于如何完成此操作的信息我需要知道如何搜索更新下载更新并从 python 脚本安
从sklearn PCA获取特征值和向量

如何获取 PCA 应用程序的特征值和特征向量 from sklearn decomposition import PCA clf PCA 0 98 whiten True converse 98 variance X train clf f
无故运行测试时 PyCharm 抛出“AttributeError: 'module' object has no attribute”

因此我有一个 Django REST Framework 项目有一天它无法在 PyCharm 中运行测试从命令行我可以使用它们来运行它们paver or the manage py直接地曾经有一段时间当我们没有在文件顶部导入类的超
cv2.drawContours() - 取消填充字符内的圆圈（Python，OpenCV）

根据 Silencer的建议我使用了他发布的代码here https stackoverflow com questions 48244328 copy shape to blank canvas opencv python 482465
“一旦获取切片就无法更新查询”。最佳实践？

由于我的项目的性质我发现自己不断地从查询集中取出切片如下所示 Thread objects filter board requested board id order by updatedate 10 但这给我带来了实际对我选择的元素进
PyTorch 给出 cuda 运行时错误

我对我的代码做了一些小小的修改以便它不使用 DataParallel and DistributedDataParallel 代码如下 import argparse import os import shutil import time
Python tkinter.filedialog Askfolder 干扰 clr

我主要在 Spyder 中工作构建需要弹出文件夹或文件浏览窗口的脚本下面的代码在spyder中完美运行在 Pycharm 中 askopenfilename工作良好同时askdirectory什么都不做卡住了但是如果在调试模式
将 numpy 代码点数组与字符串相互转换

我有一个很长的 unicode 字符串 alphabet range 0x0FFF mystr join chr random choice alphabet for in range 100 mystr re sub W mystr 我想
CNTK 抱怨 LSTM 中的动态轴

我正在尝试在 CNTK 中实现 LSTM 使用 Python 来对序列进行分类 Input 特征是固定长度的数字序列时间序列标签是 one hot 值的向量 Network input input variable input dim
在相同任务上，Keras 比 TensorFlow 慢

我正在使用 Python 运行斩首 DCNN 本例中为 Inception V3 来获取图像特征我使用的是 Anaconda Py3 6 和 Windows7 使用 TensorFlow 时我将会话保存在变量中感谢 jdehesa 并
如何使用 Bokeh 动态隐藏字形和图例项

我正在尝试在散景中实现复选框其中每个复选框应显示隐藏与其关联的行我知道可以通过图例来实现这一点但我希望这种效果同时在两个图中发生此外图例也应该更新在下面的示例中出现了复选框但不执行任何操作我显然不明白如何更新用作源的数据
如何从 JSON 响应重定向？

所以我尝试使用 Flask 和 Javascript 上传器 Dropzone 上传文件并在上传完成后重定向文件上传正常但在烧瓶中使用传统的重定向 return redirect http somesite com 不执行任何操作页面
如何在Python中按AaB而不是ABa顺序对字符串进行排序

我正在尝试对字符串进行排序为 punnetsquare 制作基因型我目前的实现是 unsorted genotype ABaB sorted genotype sorted list unsorted genotype sorted s
如何调用 google 的 getBasicProfile() 来仅单击按钮即可登录 google？

我在我的网站上使用谷歌登录
使用 pybtex 将 bibtex 转换为格式化的 HTML 参考书目，例如哈佛风格

我正在使用 Django 并将 bibtex 存储在我的模型中并且希望能够以格式化 HTML 字符串的形式向我的视图传递引用使其看起来像哈佛引用样式使用中描述的方法Pybtex 无法识别 bibtex 条目 https stackov
以编程方式使用 Sphinx 特定指令解析 .rst 文件

我希望能够在 Python 中解析基于 sphinx 的 rst 以便进一步处理和检查就像是 import sphinx p sphinx parse path to file rst do something with p 似乎在 do

随机推荐

Meteor 1.0 - 为什么“构建应用程序”花费的时间比以前长得多？

所以我刚刚更新到Meteor 1 0 在本地开发应用程序时每当我更新任何 js 文件时构建应用程序都需要大约 15 秒以上的时间在此期间控制台会显示正在构建应用程序尔格这是 1 0 中的新行为吗过去需要 1 2 秒才能看到对
无法使用 Maven“mvn package”构建 Guava

我刚刚阅读了 Guava 并查看了它的源代码但不知道如何构建它来使用我使用 mvn package 构建了 jar 文件但它生成了 Guava GWT 错误 ERROR Failed to execute goal on projec
为什么我在运行简单的 Spring Boot 应用程序时总是收到状态为“404”的 Whitelabel 错误页面

我的控制器 Controller RequestMapping ComponentScan com spring EnableAutoConfiguration public class HomeController Value frame
为什么 Gradle 不在编译/运行时类路径中包含传递依赖项？

我正在学习 Gradle 的工作原理但我无法理解它如何解决项目传递依赖关系现在我有两个项目 projectA 它对外部库有一些依赖项项目仅对项目有一个依赖项无论我如何尝试当我构建projectB时 gradle都不在proje
使用 WebKit 的简单 Swift Cocoa 应用程序：上传图片不起作用

我决定制作自己的 FB 聊天应用程序只显示https messenger com https messenger com on a WebView在尝试其他免费增值应用程序后 My ViewController swift只需几行代码
如何使用 Powershell 作为我的 trapmp-encoding-shell？

首先我启动 eshell 然后输入命令cd plink
在函数式编程中实现双向计数器？

我正在尝试了解一些函数式编程基础知识因此通过使用高阶函数我可以创建一个可以递增的计数器 function counter start var count start return function return count var m
在元数据文档中找不到 WsTrust 端点

我正在关注这个tutorial https github com Azure Samples active directory java native headless了解用户成功登录后如何获取令牌到目前为止我已经完成的步骤我已经使用以
如何 git add 仅匹配模式的行？

我正在使用 git 跟踪一些配置文件我通常会进行互动git add p但我正在寻找一种方法来自动添加与模式匹配的所有新修改删除行否则我将花费很长时间来完成所有交互式拆分和添加 git add有文件名的模式匹配但我找不到有关内容的
MS ACCESS 与 LAN 上的桌面应用程序

在不使用共享文件夹的情况下通过 LAN 托管 MS ACCESS 和桌面应用程序的最佳方式是什么您可以使用一些终端服务器 TS 例如微软的终端服务器这是 ms windows 操作系统服务器版本的一项功能还有其他可用的 TS Citr
R - 以 1 为增量的循环函数

我有以下功能 position tab lt filter Tall Time point 2 gt group by Object gt summarise minimum min Pixel pos maximum max Pixel
子菜单的 javascript 悬停功能

我在尝试理解 javascript 方面还很陌生我一直在收集多个示例试图找出我做错了什么但无法让它正常工作在某一时刻我曾使用过 onmouseover mouseout 但它只适用于其中一个菜单我确信这是我忽略的简单事情但任何
如何获取jqGrid当前的搜索条件？

我需要获得与 jqGrid 在 GET POST search 参数上传递的完全相同的东西我怎样才能做到这一点为了结束这个问题我做了以下几行 grid getGridParam postData filters 这样我就得到了当我们对
AngularJS 禁用 ngClick

在 AngularJS 中有什么办法可以制作一个ng click依赖于布尔值例如我希望以下文本 Click 可点击但是only当某些范围属性例如 rootScope enableClick is true div Click di
从套接字读取时如何检测客户端何时完成发送请求？

我现在正在编写一个 http 服务器但从套接字读取时遇到问题我的问题是inputStream来自客户端的数据永远不会结束它会一直读取直到客户端关闭我知道客户端发送http请求后并不会立即关闭与服务器的连接我怎样才能退出while
是否可以更改请求方法来转发请求？

我正在研究一个网关它只允许 GET 请求而其背后的 REST 端点能够接受各种方法 POST PUT DELETE OPTIONS 因此我尝试将请求方法作为参数传递并有一个过滤器它用正确的方法转发请求从我在规范中看到的只允许转
使用 YamlDotNet 序列化动态模型时更改用于所有多行字符串的标量样式

我使用以下代码片段将项目的动态模型序列化为字符串最终导出到 YAML 文件 dynamic exportModel exportModelConvertor ToDynamicModel project var serializerBui
带有identified(by:)的SwiftUI列表初始值设定项

我正在学习 Apple 的 SwiftUI 教程构建列表和导航 https developer apple com tutorials swiftui building lists and navigation make the list
为什么你可以在 Java 和 .Net 中反射并调用一个（不那么）私有方法

在 Java 和 C 中都可以通过反射调用私有方法如下所示为什么这是允许的这样做会产生什么后果是否应该在该语言的未来版本中删除它其他语言平台是否允许这样做如果我在 Java 和 C 中都有此类这是例子 public cla
Python 中的 Youtube 数据 API nextPageToken 循环

我根据在网上找到的许多不同示例将其拼凑在一起目标是在 youtube api 中搜索将多个页面的搜索结果转换为 csv 文件编辑由于提供的答案之一这是搜索循环的工作示例现在按预期循环了最大次数 10 但是执行时的问题是CSV

Python 中的 Youtube 数据 API nextPageToken 循环

Python 中的 Youtube 数据 API nextPageToken 循环 的相关文章

随机推荐

热门标签

Python 中的 Youtube 数据 API nextPageToken 循环的相关文章