小红书数据集—RedNote数据集
解锁中国最大的生活方式与消费决策平台数据。 本数据集完整采集了小红书平台上的高质量 UGC 内容,为您提供深入的消费趋势与用户行为洞察。数据结构清晰,完美适配市场调研、推荐算法训练及 NLP 情感分析。

支持全球主要站点
严格遵守GDPR & CCPA隐私标准
支持JSON/CSV格式测试
价格灵活,按需购买
全球超200+客户信任























可用的Xiaohongshu (Little Red Book)数据集
数据每日更新,结构化清洗,支持通过 API 或文件下载直接集成。
Xiaohongshu Notes & Metadata
Note ID, Title, Description, Media URLs, Engagement Stats.
Xiaohongshu Comments & Sentiment
Comment Text, Likes, IP Location, Nested Replies.
Xiaohongshu User Profiles
User ID, Nickname, Avatar, Xsec Token.
Xiaohongshu Trending Tags
Tag ID, Tag Name, Topic Classification.
可用的交付方式







通过智能策略最大化数据投资回报率

增量更新机制
为“新增”或“变动”的记录付费。无需重复购买整个数据库,精准降低采集成本。

多源数据组合
可购买一个或多个数据集,享受专属折扣。一次性获取跨平台全景视角,性价比更高。

企业级阶梯定价
专为大规模需求设计。购买量越大单价越低,大额提取或订阅均享深度折扣,投入更少。

数据清洗与富化
交付已清洗、去重及标准化的成品数据。无需二次处理,节省时间,直接用于业务分析。
小红书笔记内容与互动数据样本
小红书笔记数据集捕捉了平台上的核心 UGC 内容,包含笔记 ID、标题、正文描述、发布时间、内容类型(视频/图文)以及关键的“转评赞藏”互动指标。此外还包含多媒体资源链接(视频流、图片列表),是进行“种草”效果分析、内容趋势挖掘及多模态 AI 训练的基础数据。
| Name | Description | Type | Example |
|---|---|---|---|
| id | unique to each company | AZ text | highgoal–capital |
| name | The name of the company | AZ text | Highgoal Capital |
| country_code | The country where the company is located | AZ text | GB,EE |
| locations | General information about the company's locations | [ ] array | ["London, GB", "Tallinn, EE"] |
| followers | The number of followers the company has | # number | 41 |
| employees_in_linkedin | The number of employees listed on LinkedIn | # number | 2 |
| about | A description or summary of the company | AZ text | xtHighgoal Capital is a technology focused in... |
未找到所需数据集?启动定制采集
欢迎告知您的具体项目需求,我们将为您精准匹配合适的数据集,助力您的项目高效落地。

| Name | Description | Type | Example |
|---|---|---|---|
| note_id | Unique identifier for the note | AZ text | 686b353d000000001202f2fe |
| title | Title of the note | AZ text | 我有一个关于我的蔬菜的激动人心的消息! |
| desc | Main text content/caption of the note including hashtags | AZ text | 我发现了两个番茄、一个辣椒... #我的人生vlog[话题]# |
| type | Type of the note (video or image) | AZ text | video |
| liked_count | Total number of likes | AZ text | 1.2万 |
| collected_count | Total number of collections/saves | AZ text | 584 |
| comment_count | Total number of comments | AZ text | 1430 |
| share_count | Total number of shares | AZ text | 132 |
| video_url | URL to the video stream (if type is video) | ∞ url | http://sns-video-zl.xhscdn.com/stream/... |
| image_list | List of image URLs (if type is image or video cover) | [ ] list | [{"url": "http://sns-webpic-qc.xhscdn.com/..."}] |
未找到所需数据集?启动定制采集
欢迎告知您的具体项目需求,我们将为您精准匹配合适的数据集,助力您的项目高效落地。

数据集定价
从规模超大、高度合乎道德准则的提供商处购买
立即注册,首次充值,即可获赠相应奖励,最高可达2K记录。
体验套餐
100K记录起购
适合低成本验证数据需求
包含600K记录
$840.00 月付计划
满足月度市场监测与爬虫开发
包含2.5M记录
$2,800.00 半年计划
支持大规模数据采集与分析
包含13M记录
$10,400.00 年付计划
高并发需求下的性价比之选
需要千万级数据或定制采集方案?
即时增强 AI Agent 与大模型能力
我们的数据集已针对 RAG与模型微调进行深度优化。结构清晰、文档完备,提供多语言 SDK 示例,助您将电商洞察无缝集成至 AI 工作流中。

结构化数据
预处理的数据格式,适配 ChatGPT、Claude等AI模型的训练与推理需求。

多语言集成代码
提供 Python, Java,C#,Node.js 等代码片段。无需从零编写,复制粘贴即可在几秒内建立数据管道

开发者文档
提供详尽的 API 参考与字段定义文档,降低 AI 理解数据上下文的 Prompt Engineering 成本。
根据您的需求量身定制的小红书数据集
获取易用、结构完整数据集,满足多种应用场景

高效数据提取
借助纯净住宅代理IP,一键提取全球站点数据。成功率达99%,避免封禁,支持亿级规模采集。

多种输出格式
支持JSON、NDJSON、CSV、Parquet、JSON Lines、gzip压缩等多种格式,轻松集成您的系统。

灵活支付模式
价格灵活,按需购买,支持全球主要站点。严格遵守GDPR & CCPA隐私标准,保障数据安全与合规。

无限扩展架构
利用高并发代理IP处理海量请求,支持Snowflake、Google Cloud等SFTP集成,轻松应对峰值需求。

显著节省成本
优化代理IP轮换与数据提取流程,帮助您节省30%以上成本。无需自建服务器,专注业务增长。

全托管服务
我们代管整个数据采集管道,包括代理IP维护与监控。简化您的运维负担,确保24/7稳定运行。

无缝API集成
提供简单API接口,支持Webhook、S3直连。快速接入您的电商系统,提取ASIN、价格、评论等关键数据。

24/7 专业支持
专属团队随时响应,提供定制指导与故障排除。结合代理IP优化,确保数据采集高效无忧。

数据质量保障
AI驱动验证,确保数据准确、完整、无重复。支持实时监控与报告,适用于产品分析、竞品追踪、库存管理等场景。
热门小红书数据集
小红书笔记数据集
包含笔记标题、正文描述、标签及核心互动指标(点赞、收藏、分享)。适用于爆款趋势分析、种草效果评估及电商选品决策。
小红书评论数据集
记录评论正文、回复层级及用户反馈时间戳。这是进行 NLP 情感分析、消费者真实口碑监测与竞品优劣势挖掘的关键资料。
小红书用户 (KOL) 数据集
涵盖博主昵称、ID、简介及粉丝互动数据。助力构建红人画像,进行精准 KOL 筛选与品牌投放 ROI 预估。
小红书标签数据集
聚合热门话题标签、浏览量及关联笔记数。帮助品牌精准捕捉流行趋势,优化内容关键词策略 (SEO),抢占流量高地。
把时间给核心业务,繁杂的数据采集交给我们

全网无阻采集
依托动态住宅 IP 与智能解封技术,轻松突破 CAPTCHA 与地理限制。确保您能获取全球公开网页的数据点,

即用型精准数据
每一条数据都经过多重校验与清洗。交付即成品,无需繁琐的二次处理,直接赋能您的市场分析或 AI 模型训练。

全自动数据管道
支持定时任务与增量更新,数据自动推送至您的 AWS S3 或数据库,实现全程零人工值守。
公司如何使用小红书数据集
爆款挖掘与竞品分析
追踪热门笔记的“收藏”与“点赞”数据,精准捕捉美妆、时尚等领域的爆款趋势。深度解构竞品的内容策略与高频标签,优化您的选品方向,最大化内容种草的转化效率。

深度口碑与痛点挖掘
对海量评论进行 NLP 情感分析,聆听消费者对产品的真实反馈与“避雷”吐槽。快速识别负面舆情,挖掘用户未被满足的核心需求,为产品迭代提供数据支撑。

精准筛选高转化 KOL
拒绝虚假数据。基于博主历史笔记的真实互动率与粉丝画像,科学筛选高匹配度的创作者。预测投放 ROI,确保每一分预算都能实现品牌“种草”效果最大化。

关于小红书数据集的常见问题解答
小红书数据集包含哪些核心数据类型?
我们的数据集覆盖小红书生态的四大核心板块:笔记 (Notes)、评论 (Comments)、用户 (Users/KOLs) 和 标签 (Tags)。笔记数据包含图文内容与互动指标,评论记录真实反馈,用户数据提供博主画像,标签则反映热门话题趋势。
数据集包含“收藏数”指标吗?为什么它很重要?
是的,极其重要。除了点赞数 (liked_count),我们还完整采集了收藏数 (collected_count)。在小红书生态中,“收藏”代表用户有强烈的购买或尝试意向,是衡量“种草”效果和转化潜力的最核心指标,比单纯的点赞更具商业参考价值。
如何利用该数据筛选优质的 KOL 或素人博主?
利用用户 (User) 数据集中的粉丝数、历史笔记互动数据(点赞/收藏总数),您可以计算博主的真实互动率。结合笔记中的内容风格,您可以精准识别出那些虽然粉丝不多但带货能力强(高收藏率)的“KOC”或垂直领域达人。
评论数据适合做情感分析吗?
非常适合。评论数据集提供了完整的评论正文和回复层级。小红书用户的评论通常详尽且真实(如“避雷”、“亲测好用”),是训练 NLP 模型、分析产品口碑和挖掘用户痛点的绝佳语料。
我可以获取笔记中的图片或视频素材吗?
数据集包含素材链接。在笔记数据中,我们提供了 image_list(包含多张图片的 URL 列表)和视频封面信息。您可以利用这些链接进行视觉趋势分析或训练多模态 AI 模型(如识别热门穿搭风格或妆容)。
如何通过数据集追踪热门话题或流行趋势?
利用标签 (Tags) 数据集以及笔记中的 tag_list 字段,您可以聚合分析当前最热的 Hashtag。通过统计特定标签下笔记的增长量和互动热度,您可以敏锐捕捉“多巴胺穿搭”、“早C晚A”等新兴消费趋势。
数据的交付格式是什么?
所有数据均以结构化的 JSON 格式交付,字段定义清晰。例如,互动数据以数值类型存储,文本内容经过清洗,可以直接导入 Python Pandas、SQL 数据库或 BI 工具中进行分析。
这个数据集能帮我进行竞品分析吗?
可以。通过搜索特定品牌词或产品名的笔记,提取其 desc (正文描述) 和用户评论,您可以量化竞品的声量份额 (Share of Voice),并深入了解竞品在用户眼中的优缺点(如包装、成分、价格反馈)。