数据集概览
Patio Lawn & Garden 类目评论数据全貌,基于 Amazon Reviews'23 数据集
数据集概览
Patio, Lawn & Garden 是 Amazon Reviews'23 数据集中第二大的类目, 包含 500,000 条真实评论,横跨 15 年(1996–2023)。 本页面呈现驱动本站的数据全貌。
数据来源: Amazon Reviews'23 by McAuley Lab, UC San Diego
原始文件: Patio_Lawn_and_Garden.jsonl
评分分布
图:Patio, Lawn & Garden 全部评论的星级分布。
亚马逊评论存在明显的正面偏差。
| 评分 | 数量 | 占比 |
|---|---|---|
| 5 ★ | 332,740 | 66.5% |
| 4 ★ | 63,680 | 12.7% |
| 3 ★ | 34,923 | 7.0% |
| 2 ★ | 23,011 | 4.6% |
| 1 ★ | 45,646 | 9.1% |
平均评分: 4.23 / 5.00
这意味着什么
超过 83% 的评论是 4–5 星。这说明:
- 单看星级很难区分产品好坏 — 大多数产品都集中在 4.5 左右
- 1–2 星差评才是识别产品缺陷的关键信号
- 评论文本比星级更能帮助购买决策
评论真实性
| 指标 | 数量 | 占比 |
|---|---|---|
| 已验证购买 | 456,118 | 91.2% |
| 未验证来源 | 43,882 | 8.8% |
约 8.8% 的评论来自未验证来源(Vine 评测人、换评、非购买直接评价)。 已验证购买的评论可信度更高。
评论有用性
亚马逊用户可以为评论点"有帮助"。这个信号帮助我们找到最有价值的内容。
图:有帮助票数的对数分布。大多数评论获得 0 票。
| 有帮助票数 | 评论数量 | 占比 |
|---|---|---|
| 0 票 | 363,825 | 72.8% |
| ≥ 1 票 | 136,175 | 27.2% |
| ≥ 5 票 | 26,440 | 5.3% |
| ≥ 10 票 | 12,201 | 2.4% |
| ≥ 50 票 | 1,624 | 0.3% |
平均每评有帮助票数: 1.39 最高有帮助票数: 3598 票
“Okay, I read all these reviews, and expected some problems because of the 1-3 star users. But I really can’t deal with the mess and unpredictable results of spring traps, or the unwelcomed surprise o…”
洞察
仅 27.2% 的评论获得了 1 票以上的"有帮助"。这意味着:
- 获 5+ 票的评论是稀有的真实洞察信号
- 约 1,624 条评论(0.3%)获得 50+ 票 — 这些是内容策展的金矿
评论长度分布
图:评论长度的百分位分布。红色虚线为平均值。
| 百分位 | 字符数 |
|---|---|
| 25th | 51 |
| 50th (中位) | 124 |
| 75th | 270 |
| 90th | 514 |
平均长度: 224 字符
一半的评论不足 124 个字符 — 约 1–2 句话。 仅 10% 超过 514 字符。长、详尽的评论稀缺且有价值。
用户实拍图
| 指标 | 数量 | 占比 |
|---|---|---|
| 含图片评论 | 34,393 | 6.9% |
| 纯文字评论 | 465,607 | 93.1% |
仅 6.9% 的评论包含用户实拍图 — 但这类评论恰恰是消费者最信任的。
评论时间趋势
图:每年评论量(柱状)和平均评分(折线)变化趋势。
| 年份 | 评论数 | 5★ 占比 | 验证购买占比 |
|---|---|---|---|
| 2000 | 4 | 50.0% | 25.0% |
| 2001 | 6 | 66.7% | 50.0% |
| 2002 | 5 | 80.0% | 40.0% |
| 2003 | 14 | 71.4% | 14.3% |
| 2004 | 14 | 71.4% | 50.0% |
| 2005 | 38 | 42.1% | 63.2% |
| 2006 | 67 | 56.7% | 71.6% |
| 2007 | 183 | 57.4% | 71.6% |
| 2008 | 253 | 54.2% | 66.8% |
| 2009 | 447 | 52.6% | 66.4% |
| 2010 | 945 | 58.5% | 79.0% |
| 2011 | 1,798 | 54.0% | 80.0% |
| 2012 | 3,489 | 58.2% | 86.0% |
| 2013 | 10,264 | 59.1% | 91.9% |
| 2014 | 19,129 | 63.2% | 88.1% |
| 2015 | 31,383 | 65.6% | 93.6% |
| 2016 | 40,320 | 66.7% | 92.2% |
| 2017 | 41,966 | 66.4% | 93.6% |
| 2018 | 44,808 | 66.3% | 95.0% |
| 2019 | 60,384 | 71.1% | 94.5% |
| 2020 | 69,655 | 67.6% | 92.9% |
| 2021 | 82,002 | 66.5% | 90.9% |
| 2022 | 80,148 | 65.2% | 86.5% |
| 2023 | 12,678 | 68.1% | 78.4% |
统计数据由原始数据集实时计算。基于 500,000 条评论的随机抽样。使用 --full 进行全量扫描。