Mongodb扫描分析
mongodb扫描分析
策略
graph LR
A["Collection"]
A --> B["对于数据量小的collection,直接整表扫描统计分析结果"]
A --> C["对于数据量大的collection,因为内存限制、废弃的数据较多(小农女)等原因。选取站点抽样扫描"]
async_task(整表扫描)
cart字段的amount,unit_price,spu_remark存在类型不统一问题
attritem(整表扫描)
无问题,但只有5行数据,这个表是否可以删除
attritem_rel(整表扫描)
无问题,数据极少
attrvalue(整表扫描)
无问题,数据极少
attrvalue_sxu(整表扫描)
无问题,数据极少
batch_stock(黄马甲,闪送)
avg_price数据类型不一致 remain数据类型不一致 supplier_id, suppliern_name有缺少
batch_stock_flow(10000条)
old_remain, new_remain数据类型不一致
customized_info(10000条)
字段大量缺失,其中pay_type字符串和数字混用
default_config(10000条)
无问题
driver_location(10000条)
无问题
employee_station_limit(整表扫描)
无问题
error_charge_config(整表扫描)
无问题,数据极少
fqt_report(整表扫描)
无问题
freight(整表扫描)
group_id有缺失
glus_customer_supply(整表扫描)
无问题
glus_supply_chains(整表扫描)
无问题
in_stock_log(黄马甲,闪送)
float,int未区分
openapi_user(整表扫描)
无问题
order_change(整表扫描)
无问题
order_data(整表扫描)
无问题
order_delta_log(整表扫描)
无问题
order_new(黄马甲,闪送)
float和int混用
order_statistics_cycletime(黄马甲,闪送)
float,int未区分
order_statistics_orderedtime(黄马甲,闪送)
float,int未区分
order_statistics_receivedtime(黄马甲,闪送)
float,int未区分
out_batch_stock_flow(整表扫描)
status字段只有6个
out_stock_log(黄马甲,闪送)
modify_time, old_total_stock_num只有3个
out_stock_sheet(黄马甲,闪送)
quantity数字和字符串混用
price_rule(整表扫描)
极少数字段没有group_id
purchase_apply(整表扫描)
无大问题
purchase_sheet(黄马甲,闪送)
部分字段有缺失
purchase_sku_log(黄马甲,闪送)
float,int未区分
purchase_specification(黄马甲,闪送)
last_in_stock_price只有少数存在
requests_log_summary(整表扫描)
无问题
return_to_supply_log(黄马甲,闪送)
return_amount字符串和数字混用
station(站点)
少数站点无group id,大部分字段参差不齐
station(供应商)
district_name字段存在array和字符串混用的情况,且因为历史原因有大量冗余字段
stock_new
无大问题
stock_sheet(黄马甲,闪送)
money字段存在大量string类型
stock_value_new(黄马甲,闪送)
无大问题
user_config(整表扫描)
无问题
weighting_latest(扫描了10000条)
无问题
weighting_op_log(黄马甲,闪送)
无问题
weighting_spu_group(整表扫描)
无问题
wx_pay_info(整表扫描)
无问题
spu_product(黄马甲,闪送)
无问题
pinlei(黄马甲,闪送)
无问题
category_level2(黄马甲,闪送)
无问题
category_level1(黄马甲,闪送)
无问题