社交媒体数据集
一站式获取主流社交平台的原始数据。数据集整合了 TikTok 热门视频与音乐趋势、Facebook 与 X (Twitter) 的实时舆情互动、以及 Instagram 和 YouTube 的视觉内容元数据。包含 Post ID、视频链接及评论情感数据,支持全网趋势分析。

支持全球主要站点
严格遵守GDPR & CCPA隐私标准
支持JSON/CSV格式测试
价格灵活,按需购买
全球超200+客户信任























可用的社交媒体数据集
数据每日更新,结构化清洗,支持通过 API 或文件下载直接集成。
Reddit Community (Subreddit) Data
Subreddit Name, Subscribers, Description, Rules.
Reddit Comments & Conversations
Comment Body, Author, Nested Replies, Score, Timestamp.
TikTok User Comment Sentiment
Comment Text, Timestamps, Usernames, Reply structures.
TikTok Viral Music Tracks
Music IDs, Titles, Artists, Audio URLs, Usage context.
Instagram Profiles Data
Profile Name, Bio/Title, External Links, Contact Info.
Xiaohongshu Notes & Metadata
Note ID, Title, Description, Media URLs, Engagement Stats.
Facebook Comments Data
Comment ID, Text, Author Name, User ID, Creation Timestamp, Like Count.
Instagram Comments Data
Comment ID, Text, Author Username, User ID, Creation Timestamp.
Xiaohongshu Comments & Sentiment
Comment Text, Likes, IP Location, Nested Replies.
TikTok Trending Video Posts
Video Metadata, Play/Like/Share Stats, URLs, Hashtags, and more.
Instagram Posts Data
Post ID, Content, Date, URL, Engagement Metrics (Likes, Comments), Image URLs.
Xiaohongshu User Profiles
User ID, Nickname, Avatar, Xsec Token.
X Engagement Metrics
Likes, Retweets, Replies, Bookmarks, Quote Counts.
TikTok Creator Profiles
User IDs, Handles, Nicknames, Avatars from posts and comments.
Reddit Submissions & Posts
Title, Selftext, Subreddit, Author, Score, Upvote Ratio.
Facebook Posts Data
Post ID, Content, Date, URL, Engagement Metrics (Likes, Comments, Shares), Image URLs.
YouTube User Comments
Comment ID, Text, Author, Likes, Replies, Time, Sentiment data, and more.
Xiaohongshu Trending Tags
Tag ID, Tag Name, Topic Classification.
Facebook Profiles Data
Profile Name, Title, Email, Phone, Website, Address.
X (Twitter) Tweet Streams
Tweet Text, Creation Time, URL, Views, Hashtags.
YouTube Video Metadata
Video ID, Title, Description, Channel, Views, Likes, Duration, Keywords, and more.
X Multimedia Data
Image URLs, Media Type, Dimensions, Media Keys.
可用的交付方式







通过智能策略最大化数据投资回报率

增量更新机制
为“新增”或“变动”的记录付费。无需重复购买整个数据库,精准降低采集成本。

多源数据组合
可购买一个或多个数据集,享受专属折扣。一次性获取跨平台全景视角,性价比更高。

企业级阶梯定价
专为大规模需求设计。购买量越大单价越低,大额提取或订阅均享深度折扣,投入更少。

数据清洗与富化
交付已清洗、去重及标准化的成品数据。无需二次处理,节省时间,直接用于业务分析。
Facebook 帖子数据集样本
Facebook 帖子数据集捕捉了平台上的核心内容动态,包括发布时间、发布者用户名、帖子内容、多媒体链接(图片/视频)、帖子永久链接以及点赞数、评论数、分享数等互动指标。该数据可用于内容策略分析、品牌声量监测、趋势识别及用户参与度评估。
| Name | Description | Type | Example |
|---|---|---|---|
| id | unique to each company | AZ text | highgoal–capital |
| name | The name of the company | AZ text | Highgoal Capital |
| country_code | The country where the company is located | AZ text | GB,EE |
| locations | General information about the company's locations | [ ] array | ["London, GB", "Tallinn, EE"] |
| followers | The number of followers the company has | # number | 41 |
| employees_in_linkedin | The number of employees listed on LinkedIn | # number | 2 |
| about | A description or summary of the company | AZ text | xtHighgoal Capital is a technology focused in... |
未找到所需数据集?启动定制采集
欢迎告知您的具体项目需求,我们将为您精准匹配合适的数据集,助力您的项目高效落地。

| Name | Description | Type | Example |
|---|---|---|---|
| Post ID | Unique identifier for the post | AZ text | POSTID_db0ca14e9f |
| Date/Time | Timestamp of when the post was created | AZ date | 2026-01-17 14:00:00 |
| Username | Username of the account that posted | AZ text | A****************D |
| Post Content | The text content of the post | AZ text | ✨MILLION DOLLAR GROUP - PACESETTER✨... |
| Post URL | Direct URL to the Facebook post | ∞ url | https://www.facebook.com/photo/?fbid=1440237371435729&set=a.503339355125540 |
| Image | List of URLs for images contained in the post | [ ] list | ["https://scontent-ord5-2.xx.fbcdn.net/v/t39.30808-6/... (masked)"] |
| like_count | Number of likes the post received | # integer | 3 |
| comment_count | Number of comments on the post | # integer | 0 |
| share_count | Number of shares the post received | # integer | 0 |
未找到所需数据集?启动定制采集
欢迎告知您的具体项目需求,我们将为您精准匹配合适的数据集,助力您的项目高效落地。

数据集定价
从规模超大、高度合乎道德准则的提供商处购买
立即注册,首次充值,即可获赠相应奖励,最高可达2K记录。
体验套餐
100K记录起购
适合低成本验证数据需求
包含600K记录
$840.00 月付计划
满足月度市场监测与爬虫开发
包含2.5M记录
$2,800.00 半年计划
支持大规模数据采集与分析
包含13M记录
$10,400.00 年付计划
高并发需求下的性价比之选
需要千万级数据或定制采集方案?
即时增强 AI Agent 与大模型能力
我们的数据集已针对 RAG与模型微调进行深度优化。结构清晰、文档完备,提供多语言 SDK 示例,助您将电商洞察无缝集成至 AI 工作流中。

结构化数据
预处理的数据格式,适配 ChatGPT、Claude等AI模型的训练与推理需求。

多语言集成代码
提供 Python, Java,C#,Node.js 等代码片段。无需从零编写,复制粘贴即可在几秒内建立数据管道

开发者文档
提供详尽的 API 参考与字段定义文档,降低 AI 理解数据上下文的 Prompt Engineering 成本。
根据您的需求量身定制的社交媒体数据集
获取易用、结构完整数据集,满足多种应用场景

高效数据提取
借助纯净住宅代理IP,一键提取全球站点数据。成功率达99%,避免封禁,支持亿级规模采集。

多种输出格式
支持JSON、NDJSON、CSV、Parquet、JSON Lines、gzip压缩等多种格式,轻松集成您的系统。

灵活支付模式
价格灵活,按需购买,支持全球主要站点。严格遵守GDPR & CCPA隐私标准,保障数据安全与合规。

无限扩展架构
利用高并发代理IP处理海量请求,支持Snowflake、Google Cloud等SFTP集成,轻松应对峰值需求。

显著节省成本
优化代理IP轮换与数据提取流程,帮助您节省30%以上成本。无需自建服务器,专注业务增长。

全托管服务
我们代管整个数据采集管道,包括代理IP维护与监控。简化您的运维负担,确保24/7稳定运行。

无缝API集成
提供简单API接口,支持Webhook、S3直连。快速接入您的电商系统,提取ASIN、价格、评论等关键数据。

24/7 专业支持
专属团队随时响应,提供定制指导与故障排除。结合代理IP优化,确保数据采集高效无忧。

数据质量保障
AI驱动验证,确保数据准确、完整、无重复。支持实时监控与报告,适用于产品分析、竞品追踪、库存管理等场景。
热门社交媒体数据集
Facebook 数据集
Facebook 数据集(帖子、评论、个人资料)涵盖所有主要数据点,支持品牌舆情监控、竞品策略分析及全网互动量化,包含数亿条记录。
Instagram 数据集
Instagram 数据集(帖子、KOL 资料、视觉内容)捕捉核心视觉动态与红人信息,赋能红人营销匹配与视觉趋势识别,包含数千万条记录。
TikTok 数据集
TikTok 数据集(视频趋势、创作者、音乐)提供无水印视频链接及下载统计,助力病毒式内容挖掘与短视频算法研究,包含海量实时数据。
YouTube 数据集
YouTube 数据集(视频元数据、评论、频道)详尽记录观看时长与用户反馈,核心用于视频 SEO 优化与内容推荐系统训练,包含数百万条记录。
X (Twitter) 数据集
X (Twitter) 数据集(实时推文、媒体附件)捕捉全球实时信息流与转推互动,适用于突发新闻追踪与社会舆情监听,包含数亿条推文数据。
Reddit数据集
覆盖帖子标题、正文、嵌套评论及投票分数。适用于NLP情感分析、舆情监测及特定社区话题挖掘,是训练对话模型与洞察民意的最佳资料。
小红书数据集
收录笔记图文、收藏数及评论互动。核心用于电商爆款趋势分析、精准KOL筛选及消费者口碑洞察,助力品牌抢占市场先机。
把时间给核心业务,繁杂的数据采集交给我们

全网无阻采集
依托动态住宅 IP 与智能解封技术,轻松突破 CAPTCHA 与地理限制。确保您能获取全球公开网页的数据点,

即用型精准数据
每一条数据都经过多重校验与清洗。交付即成品,无需繁琐的二次处理,直接赋能您的市场分析或 AI 模型训练。

全自动数据管道
支持定时任务与增量更新,数据自动推送至您的 AWS S3 或数据库,实现全程零人工值守。
企业如何使用社交媒体数据集
筛选高价值 KOL
拒绝无效投放。基于真实粉丝数、互动率及话题相关性,科学识别各平台最具影响力的创作者。利用详细的红人画像与历史表现数据,精准匹配品牌调性,最大化推广 ROI。

追踪用户真实口碑
深入洞察客户心声。通过分析海量评论与帖子中的点赞、分享及标签数据,精准捕捉用户对产品的情感倾向。快速发现人气趋势变化,为产品迭代提供数据支撑。

品牌声誉与危机预警
掌控品牌声誉。捕获社交网络上的正负面提及(Mentions),快速响应客户的赞美或担忧。利用数据监控潜在的公关风险,化被动为主动,维护品牌形象与客户信任。

关于社交媒体数据集的常见问题解答
该数据集覆盖了哪些主流社交媒体平台?
我们的综合数据集一站式覆盖全球五大核心社媒平台:Facebook (帖子/评论/资料)、Instagram (视觉内容/KOL)、TikTok (短视频趋势/音乐)、YouTube (长视频/频道) 以及 X (Twitter) (实时推文流)。此外还包含 LinkedIn 的职业与公司数据。
这些数据可以用于训练 NLP 情感分析模型吗?
非常适合。所有平台的数据集都包含大量的非结构化文本字段,如 Facebook 和 Instagram 的 text (评论内容)、YouTube 的 description (视频描述) 以及 X (Twitter) 的 Content (推文正文)。这些带有时间戳和用户互动的真实语料是训练自然语言处理 (NLP) 模型的理想资源。
如何利用这些数据进行红人 (KOL) 筛选与营销匹配?
您可以利用 Instagram 和 TikTok 的用户资料数据集。通过分析 followers (粉丝数)、bio (个人简介) 以及帖子中的 engagement_rate (互动率,基于点赞和评论计算),您可以精准筛选出与品牌调性相符的创作者。Facebook 资料中甚至包含公开的 email 和 website,便于直接建联。
数据集能帮助我监控竞争对手的品牌声量吗?
可以。通过 Facebook 和 X (Twitter) 的数据集,您可以追踪特定品牌关键词的提及情况。利用 share_count (分享数)、retweet_count (转推数) 和 view_count (浏览量) 等指标,您可以量化竞品活动的传播效果,并分析用户对竞品的真实反馈。
YouTube 数据集包含哪些 SEO 优化相关的字段?
YouTube 数据集非常适合视频 SEO 研究。核心字段包括 title (视频标题)、keywords (视频标签/Tags)、duration_seconds (时长) 以及 description (描述)。分析这些元数据与 view_count (播放量) 的相关性,有助于优化您的内容策略。
数据是以什么格式交付的?结构复杂吗?
所有数据均采用标准的 JSON 格式交付,结构清晰,易于解析。例如,多媒体链接以列表 (list) 形式存储,数值指标以整数 (integer) 存储,时间戳格式统一(如 Unix 时间戳或 ISO 日期),可直接导入 Python Pandas 或 SQL 数据库中。
这种数据对于电商选品有帮助吗?
有很大帮助。通过分析 TikTok 和 Instagram 上热门帖子中的 Hashtag 和产品展示,您可以发现新兴的消费趋势(如 #TikTokMadeMeBuyIt)。结合 Facebook 评论中的用户情感倾向,您可以了解消费者对特定品类的真实需求痛点,从而指导电商选品。