小红书数据集—RedNote数据集
解锁中国最大的生活方式与消费决策平台数据。 本数据集收集了小红书平台上的高质量 UGC 内容,为您提供深入的消费趋势与用户行为洞察。数据结构清晰,完美适配市场调研、推荐算法训练及 NLP 情感分析。
支持全球主要站点
严格遵守GDPR & CCPA隐私标准
支持JSON/CSV格式测试
价格灵活,按需购买
全球超200+客户信任
可用的Xiaohongshu (Little Red Book)数据集
数据每日更新,结构化清洗,支持通过 API 或文件下载直接集成。
Xiaohongshu Notes & Metadata
Note ID, Title, Description, Media URLs, Engagement Stats.
Xiaohongshu Comments & Sentiment
Comment Text, Likes, IP Location, Nested Replies.
Xiaohongshu User Profiles
User ID, Nickname, Avatar, Xsec Token.
Xiaohongshu Trending Tags
Tag ID, Tag Name, Topic Classification.
可用的交付方式
通过智能策略最大化数据投资回报率
定期更新支持
支持按周期获取最新数据内容,帮助团队持续维护数据时效性,减少重复采购成本。
多字段组合交付
可根据业务需求选择所需字段和数据范围,便于用于分析、研究和业务支持。
企业级批量采购
面向大规模数据需求提供更灵活的采购方式,适合长期使用和批量交付场景。
结构化结果交付
提供更便于使用的数据结果形式,帮助团队更快完成导入、整理和后续分析。
小红书笔记内容与互动数据样本
小红书笔记数据集捕捉了平台上的核心 UGC 内容,包含笔记 ID、标题、正文描述、发布时间、内容类型(视频/图文)以及关键的“转评赞藏”互动指标。此外还包含多媒体资源链接(视频流、图片列表),是进行“种草”效果分析、内容趋势挖掘及多模态 AI 训练的基础数据。
| Name | Description | Type | Example |
|---|---|---|---|
| id | unique to each company | AZ text | highgoal–capital |
| name | The name of the company | AZ text | Highgoal Capital |
| country_code | The country where the company is located | AZ text | GB,EE |
| locations | General information about the company's locations | [ ] array | ["London, GB", "Tallinn, EE"] |
| followers | The number of followers the company has | # number | 41 |
| employees_in_linkedin | The number of employees listed on LinkedIn | # number | 2 |
| about | A description or summary of the company | AZ text | xtHighgoal Capital is a technology focused in... |
未找到所需数据集?启动定制采集
欢迎告知您的具体项目需求,我们将为您精准匹配合适的数据集,助力您的项目高效落地。
| Name | Description | Type | Example |
|---|---|---|---|
| note_id | Unique identifier for the note | AZ text | 686b353d000000001202f2fe |
| title | Title of the note | AZ text | 我有一个关于我的蔬菜的激动人心的消息! |
| desc | Main text content/caption of the note including hashtags | AZ text | 我发现了两个番茄、一个辣椒... #我的人生vlog[话题]# |
| type | Type of the note (video or image) | AZ text | video |
| liked_count | Total number of likes | AZ text | 1.2万 |
| collected_count | Total number of collections/saves | AZ text | 584 |
| comment_count | Total number of comments | AZ text | 1430 |
| share_count | Total number of shares | AZ text | 132 |
| video_url | URL to the video stream (if type is video) | ∞ url | http://sns-video-zl.xhscdn.com/stream/... |
| image_list | List of image URLs (if type is image or video cover) | [ ] list | [{"url": "http://sns-webpic-qc.xhscdn.com/..."}] |
未找到所需数据集?启动定制采集
欢迎告知您的具体项目需求,我们将为您精准匹配合适的数据集,助力您的项目高效落地。
数据集定价
从规模超大、高度合乎道德准则的提供商处购买
立即注册,首次充值,即可获赠相应奖励,最高可达2K记录。
体验套餐
100K记录起购
适合小规模验证与初步使用
包含600K记录
$840.00 月付计划
适合中等规模的月度需求
包含2.5M记录
$2,800.00 半年计划
适合持续增长中的数据需求
包含13M记录
$10,400.00 年付计划
适合大型企业的长期数据方案
需要千万级数据或定制采集方案?
即时增强 AI Agent 与大模型能力
我们的数据集可用于 AI 数据准备、检索增强和业务分析场景,支持结构化交付、开发接入与文档说明,便于团队更快完成集成与应用。
结构化结果交付
提供便于处理和分析的数据结果形式,适合用于 AI 数据准备、知识库构建和业务分析场景。
多语言接入示例
提供常见开发语言的接入参考,帮助团队更快完成 LinkedIn 数据集的系统接入与调用。
开发文档支持
提供接口说明、字段文档与使用指引,便于开发团队理解数据结构并完成后续集成。
根据您的需求量身定制的小红书数据集
获取易用、结构完整数据集,满足多种应用场景和需求
结构化结果交付
提供便于处理和分析的数据结果形式,帮助团队更快完成导入、整理与后续应用。
多种输出格式
支持 JSON、CSV、Parquet 等常见格式,便于接入数据库、BI 工具与内部系统。
灵活采购方式
支持标准套餐与定制方案,便于根据业务规模、预算和交付周期灵活选择。
定期更新支持
利用高并发代理IP处理海量请求,支持Snowflake、Google Cloud等SFTP集成,轻松应对峰值需求。
批量数据交付
适合中大型数据需求场景,支持更大规模的数据交付与长期采购安排。
定制数据方案
可根据字段范围、更新频率和交付要求提供定制服务,满足不同业务需求。
API 与系统对接
支持与现有系统、数据平台和工作流进行对接,便于后续处理与自动化使用。
专业服务支持
提供文档说明、字段指导和交付协助,帮助团队更顺利完成接入与使用。
数据质量保障
重视数据完整性与结果可用性,便于用于分析、研究和业务支持场景。
热门小红书数据集
小红书笔记数据集
包含笔记标题、正文描述、标签及核心互动指标(点赞、收藏、分享)。适用于爆款趋势分析、种草效果评估及电商选品决策。
小红书评论数据集
记录评论正文、回复层级及用户反馈时间戳。这是进行 NLP 情感分析、消费者真实口碑分析与竞品优劣势挖掘的关键资料。
小红书用户 (KOL) 数据集
涵盖博主昵称、ID、简介及粉丝互动数据。助力构建红人画像,进行精准 KOL 筛选与品牌投放 ROI 预估。
小红书标签数据集
聚合热门话题标签、浏览量及关联笔记数。帮助品牌精准捕捉流行趋势,优化内容关键词策略 (SEO),抢占流量高地。
把时间留给核心业务,数据交付交给我们
多地区数据交付
支持按国家、地区或业务范围获取所需数据内容,帮助团队更高效地完成市场研究与业务分析。
结构化结果可用
提供便于分析和处理的数据结果形式,减少后续整理成本,适合业务分析、研究和 AI 数据准备场景。
自动化交付支持
支持按周期更新与批量交付,可对接常见数据平台和存储环境,帮助团队更轻松地完成后续使用。
公司如何使用小红书数据集
爆款挖掘与竞品分析
追踪热门笔记的“收藏”与“点赞”数据,精准捕捉美妆、时尚等领域的爆款趋势。深度解构竞品的内容策略与高频标签,优化您的选品方向,最大化内容种草的转化效率。
深度口碑与痛点挖掘
对海量评论进行 NLP 情感分析,聆听消费者对产品的真实反馈与“避雷”吐槽。快速识别负面舆情,挖掘用户未被满足的核心需求,为产品迭代提供数据支撑。
精准筛选高转化 KOL
拒绝虚假数据。基于博主历史笔记的真实互动率与粉丝画像,科学筛选高匹配度的创作者。预测投放 ROI,确保每一分预算都能实现品牌“种草”效果最大化。
关于小红书数据集的常见问题解答
小红书数据集包含哪些核心数据类型?
我们的数据集覆盖小红书生态的四大核心板块:笔记 (Notes)、评论 (Comments)、用户 (Users/KOLs) 和 标签 (Tags)。笔记数据包含图文内容与互动指标,评论记录真实反馈,用户数据提供博主画像,标签则反映热门话题趋势。
数据集包含“收藏数”指标吗?为什么它很重要?
是的,极其重要。除了点赞数 (liked_count),我们还完整采集了收藏数 (collected_count)。在小红书生态中,“收藏”代表用户有强烈的购买或尝试意向,是衡量“种草”效果和转化潜力的最核心指标,比单纯的点赞更具商业参考价值。
如何利用该数据筛选优质的 KOL 或素人博主?
利用用户 (User) 数据集中的粉丝数、历史笔记互动数据(点赞/收藏总数),您可以计算博主的真实互动率。结合笔记中的内容风格,您可以精准识别出那些虽然粉丝不多但带货能力强(高收藏率)的“KOC”或垂直领域达人。
评论数据适合做情感分析吗?
非常适合。评论数据集提供了完整的评论正文和回复层级。小红书用户的评论通常详尽且真实(如“使用简单”、“亲测好用”),是训练 NLP 模型、分析产品口碑和挖掘用户痛点的绝佳语料。
我可以获取笔记中的图片或视频素材吗?
数据集包含素材链接。在笔记数据中,我们提供了 image_list(包含多张图片的 URL 列表)和视频封面信息。您可以利用这些链接进行视觉趋势分析或训练多模态 AI 模型(如识别热门穿搭风格或妆容)。
如何通过数据集追踪热门话题或流行趋势?
利用标签 (Tags) 数据集以及笔记中的 tag_list 字段,您可以聚合分析当前最热的 Hashtag。通过统计特定标签下笔记的增长量和互动热度,您可以敏锐捕捉“多巴胺穿搭”、“早C晚A”等新兴消费趋势。
数据的交付格式是什么?
所有数据均以结构化的 JSON 格式交付,字段定义清晰。例如,互动数据以数值类型存储,文本内容经过筛选,可以直接导入 Python Pandas、SQL 数据库或 BI 工具中进行分析。
这个数据集能帮我进行竞品分析吗?
可以。通过搜索特定品牌词或产品名的笔记,提取其 desc (正文描述) 和用户评论,您可以量化竞品的声量份额 (Share of Voice),并深入了解竞品在用户眼中的优缺点(如包装、成分、价格反馈)。