社交媒体数据集
一站式获取主流社交平台的原始数据。数据集整合了 TikTok 热门视频与音乐趋势、Facebook 与 X (Twitter) 的实时舆情互动、以及 Instagram 和 YouTube 的视觉内容元数据。包含 Post ID、视频链接及评论情感数据,支持全网趋势分析。
支持全球主要站点
严格遵守GDPR & CCPA隐私标准
支持JSON/CSV格式测试
价格灵活,按需购买
全球超200+客户信任
可用的社交媒体数据集
数据每日更新,结构化清洗,支持通过 API 或文件下载直接集成。
Reddit Community (Subreddit) Data
Subreddit Name, Subscribers, Description, Rules.
Reddit Comments & Conversations
Comment Body, Author, Nested Replies, Score, Timestamp.
TikTok User Comment Sentiment
Comment Text, Timestamps, Usernames, Reply structures.
TikTok Viral Music Tracks
Music IDs, Titles, Artists, Audio URLs, Usage context.
Instagram Profiles Data
Profile Name, Bio/Title, External Links, Contact Info.
Xiaohongshu Notes & Metadata
Note ID, Title, Description, Media URLs, Engagement Stats.
Facebook Comments Data
Comment ID, Text, Author Name, User ID, Creation Timestamp, Like Count.
Instagram Comments Data
Comment ID, Text, Author Username, User ID, Creation Timestamp.
Xiaohongshu Comments & Sentiment
Comment Text, Likes, IP Location, Nested Replies.
TikTok Trending Video Posts
Video Metadata, Play/Like/Share Stats, URLs, Hashtags, and more.
Instagram Posts Data
Post ID, Content, Date, URL, Engagement Metrics (Likes, Comments), Image URLs.
Xiaohongshu User Profiles
User ID, Nickname, Avatar, Xsec Token.
X Engagement Metrics
Likes, Retweets, Replies, Bookmarks, Quote Counts.
TikTok Creator Profiles
User IDs, Handles, Nicknames, Avatars from posts and comments.
Reddit Submissions & Posts
Title, Selftext, Subreddit, Author, Score, Upvote Ratio.
Facebook Posts Data
Post ID, Content, Date, URL, Engagement Metrics (Likes, Comments, Shares), Image URLs.
YouTube User Comments
Comment ID, Text, Author, Likes, Replies, Time, Sentiment data, and more.
Xiaohongshu Trending Tags
Tag ID, Tag Name, Topic Classification.
Facebook Profiles Data
Profile Name, Title, Email, Phone, Website, Address.
X (Twitter) Tweet Streams
Tweet Text, Creation Time, URL, Views, Hashtags.
YouTube Video Metadata
Video ID, Title, Description, Channel, Views, Likes, Duration, Keywords, and more.
X Multimedia Data
Image URLs, Media Type, Dimensions, Media Keys.
可用的交付方式
通过智能策略最大化数据投资回报率
定期更新支持
支持按周期获取最新数据内容,帮助团队持续维护数据时效性,减少重复采购成本。
多字段组合交付
可根据业务需求选择所需字段和数据范围,便于用于分析、研究和业务支持。
企业级批量采购
面向大规模数据需求提供更灵活的采购方式,适合长期使用和批量交付场景。
结构化结果交付
提供更便于使用的数据结果形式,帮助团队更快完成导入、整理和后续分析。
Facebook 帖子数据集样本
Facebook 帖子数据集捕捉了平台上的核心内容动态,包括发布时间、发布者用户名、帖子内容、多媒体链接(图片/视频)、帖子永久链接以及点赞数、评论数、分享数等互动指标。该数据可用于内容策略分析、品牌声量监测、趋势识别及用户参与度评估。
| Name | Description | Type | Example |
|---|---|---|---|
| id | unique to each company | AZ text | highgoal–capital |
| name | The name of the company | AZ text | Highgoal Capital |
| country_code | The country where the company is located | AZ text | GB,EE |
| locations | General information about the company's locations | [ ] array | ["London, GB", "Tallinn, EE"] |
| followers | The number of followers the company has | # number | 41 |
| employees_in_linkedin | The number of employees listed on LinkedIn | # number | 2 |
| about | A description or summary of the company | AZ text | xtHighgoal Capital is a technology focused in... |
未找到所需数据集?启动定制采集
欢迎告知您的具体项目需求,我们将为您精准匹配合适的数据集,助力您的项目高效落地。
| Name | Description | Type | Example |
|---|---|---|---|
| Post ID | Unique identifier for the post | AZ text | POSTID_db0ca14e9f |
| Date/Time | Timestamp of when the post was created | AZ date | 2026-01-17 14:00:00 |
| Username | Username of the account that posted | AZ text | A****************D |
| Post Content | The text content of the post | AZ text | ✨MILLION DOLLAR GROUP - PACESETTER✨... |
| Post URL | Direct URL to the Facebook post | ∞ url | https://www.facebook.com/photo/?fbid=1440237371435729&set=a.503339355125540 |
| Image | List of URLs for images contained in the post | [ ] list | ["https://scontent-ord5-2.xx.fbcdn.net/v/t39.30808-6/... (masked)"] |
| like_count | Number of likes the post received | # integer | 3 |
| comment_count | Number of comments on the post | # integer | 0 |
| share_count | Number of shares the post received | # integer | 0 |
未找到所需数据集?启动定制采集
欢迎告知您的具体项目需求,我们将为您精准匹配合适的数据集,助力您的项目高效落地。
数据集定价
从规模超大、高度合乎道德准则的提供商处购买
立即注册,首次充值,即可获赠相应奖励,最高可达2K记录。
体验套餐
100K记录起购
适合小规模验证与初步使用
包含600K记录
$840.00 月付计划
适合中等规模的月度需求
包含2.5M记录
$2,800.00 半年计划
适合持续增长中的数据需求
包含13M记录
$10,400.00 年付计划
适合大型企业的长期数据方案
需要千万级数据或定制采集方案?
即时增强 AI Agent 与大模型能力
我们的数据集可用于 AI 数据准备、检索增强和业务分析场景,支持结构化交付、开发接入与文档说明,便于团队更快完成集成与应用。
结构化结果交付
提供便于处理和分析的数据结果形式,适合用于 AI 数据准备、知识库构建和业务分析场景。
多语言接入示例
提供常见开发语言的接入参考,帮助团队更快完成 LinkedIn 数据集的系统接入与调用。
开发文档支持
提供接口说明、字段文档与使用指引,便于开发团队理解数据结构并完成后续集成。
根据您的需求量身定制的社交媒体数据集
获取易用、结构完整数据集,满足多种应用场景和需求
结构化结果交付
提供便于处理和分析的数据结果形式,帮助团队更快完成导入、整理与后续应用。
多种输出格式
支持 JSON、CSV、Parquet 等常见格式,便于接入数据库、BI 工具与内部系统。
灵活采购方式
支持标准套餐与定制方案,便于根据业务规模、预算和交付周期灵活选择。
定期更新支持
利用高并发代理IP处理海量请求,支持Snowflake、Google Cloud等SFTP集成,轻松应对峰值需求。
批量数据交付
适合中大型数据需求场景,支持更大规模的数据交付与长期采购安排。
定制数据方案
可根据字段范围、更新频率和交付要求提供定制服务,满足不同业务需求。
API 与系统对接
支持与现有系统、数据平台和工作流进行对接,便于后续处理与自动化使用。
专业服务支持
提供文档说明、字段指导和交付协助,帮助团队更顺利完成接入与使用。
数据质量保障
重视数据完整性与结果可用性,便于用于分析、研究和业务支持场景。
热门社交媒体数据集
Facebook 数据集
Facebook 数据集(帖子、评论、个人资料)涵盖所有主要数据点,支持品牌舆情分析、竞品策略分析及全网互动量化,包含数亿条记录。
Instagram 数据集
Instagram 数据集(帖子、KOL 资料、视觉内容)捕捉核心视觉动态与红人信息,赋能红人营销匹配与视觉趋势识别,包含数千万条记录。
TikTok 数据集
TikTok 数据集(视频趋势、创作者、音乐)提供无水印视频链接及下载统计,助力内容挖掘与短视频算法研究,包含海量实时数据。
YouTube 数据集
YouTube 数据集(视频元数据、评论、频道)详尽记录观看时长与用户反馈,核心用于视频 SEO 优化与内容推荐系统训练,包含数百万条记录。
X (Twitter) 数据集
X (Twitter) 数据集(实时推文、媒体附件)捕捉全球实时信息流与转推互动,适用于突发新闻追踪与社会舆情分析,包含数亿条推文数据。
Reddit数据集
覆盖帖子标题、正文、嵌套评论及投票分数。适用于NLP情感分析、舆情分析及特定社区话题挖掘,是训练对话模型与洞察民意的最佳资料。
小红书数据集
收录笔记图文、收藏数及评论互动。核心用于电商爆款趋势分析、精准KOL筛选及消费者口碑洞察,助力品牌抢占市场先机。
把时间留给核心业务,数据交付交给我们
多地区数据交付
支持按国家、地区或业务范围获取所需数据内容,帮助团队更高效地完成市场研究与业务分析。
结构化结果可用
提供便于分析和处理的数据结果形式,减少后续整理成本,适合业务分析、研究和 AI 数据准备场景。
自动化交付支持
支持按周期更新与批量交付,可对接常见数据平台和存储环境,帮助团队更轻松地完成后续使用。
企业如何使用社交媒体数据集
筛选高价值 KOL
拒绝无效投放。基于真实粉丝数、互动率及话题相关性,科学识别各平台最具影响力的创作者。利用详细的红人画像与历史表现数据,精准匹配品牌调性,最大化推广 ROI。
调研用户真实口碑
深入洞察客户心声。通过分析海量评论与帖子中的点赞、分享及标签数据,精准捕捉用户对产品的情感倾向。快速发现人气趋势变化,为产品迭代提供数据支撑。
品牌声誉与危机预警
掌控品牌声誉。捕获社交网络上的正负面提及(Mentions),快速响应客户的赞美或担忧。利用数据分析潜在的公关风险,化被动为主动,维护品牌形象与客户信任。
关于社交媒体数据集的常见问题解答
该数据集覆盖了哪些主流社交媒体平台?
我们的综合数据集一站式覆盖全球五大核心社媒平台:Facebook (帖子/评论/资料)、Instagram (视觉内容/KOL)、TikTok (短视频趋势/音乐)、YouTube (长视频/频道) 以及 X (Twitter) (实时推文流)。此外还包含 LinkedIn 的职业与公司数据。
这些数据可以用于训练 NLP 情感分析模型吗?
非常适合。所有平台的数据集都包含大量的非结构化文本字段,如 Facebook 和 Instagram 的 text (评论内容)、YouTube 的 description (视频描述) 以及 X (Twitter) 的 Content (推文正文)。这些带有时间戳和用户互动的真实语料是训练自然语言处理 (NLP) 模型的理想资源。
如何利用这些数据进行红人 (KOL) 筛选与营销匹配?
您可以利用 Instagram 和 TikTok 的用户资料数据集。通过分析 followers (粉丝数)、bio (个人简介) 以及帖子中的 engagement_rate (互动率,基于点赞和评论计算),您可以精准筛选出与品牌调性相符的创作者。Facebook 资料中甚至包含公开的 email 和 website,便于直接建联。
数据集能帮助我分析竞争对手的品牌声量吗?
可以。通过 Facebook 和 X (Twitter) 的数据集,您可以追踪特定品牌关键词的提及情况。利用 share_count (分享数)、retweet_count (转推数) 和 view_count (浏览量) 等指标,您可以量化竞品活动的传播效果,并分析用户对竞品的真实反馈。
YouTube 数据集包含哪些 SEO 优化相关的字段?
YouTube 数据集非常适合视频 SEO 研究。核心字段包括 title (视频标题)、keywords (视频标签/Tags)、duration_seconds (时长) 以及 description (描述)。分析这些元数据与 view_count (播放量) 的相关性,有助于优化您的内容策略。
数据是以什么格式交付的?结构复杂吗?
所有数据均采用标准的 JSON 格式交付,结构清晰,易于解析。例如,多媒体链接以列表 (list) 形式存储,数值指标以整数 (integer) 存储,时间戳格式统一(如 Unix 时间戳或 ISO 日期),可直接导入 Python Pandas 或 SQL 数据库中。
这种数据对于电商选品有帮助吗?
有很大帮助。通过分析 TikTok 和 Instagram 上热门帖子中的 Hashtag 和产品展示,您可以发现新兴的消费趋势(如 #TikTokMadeMeBuyIt)。结合 Facebook 评论中的用户情感倾向,您可以了解消费者对特定品类的真实需求痛点,从而指导电商选品。