MongoDB字符串截取和分组统计

查询集合operation_log根据params_str字段中org_name进行汇总统计数据。

// 1
{
    "_id": ObjectId("6257"),
    "params_str": "{'time_begin': '2022-04-21', 'time_end': '2022-04-21', 'org_name': '北京', 'rt_type': 'potential_customer'}"
}

// 2
{
    "_id": ObjectId("6258"),
    "params_str": "{'time_begin': '2022-04-21', 'time_end': '2022-04-21', 'org_name': '北京', 'rt_type': 'potential_customer'}"
}

// 3
{
    "_id": ObjectId("625c"),
    "params_str": "{'time_begin': '2022-04-21', 'time_end': '2022-04-21', 'org_name': '北京', 'rt_type': 'potential_customer'}"
}

params_str字段是一个字符串,非json格式,需要处理。
这里只是简单以“,”号分割数据,做简单的汇总查询。

db.operation_log.aggregate(
    [
				{  "$match": {  //过滤条件取params_str不为空的字段
                "params_str": {$ne: null}}
        }
			,
			{"$project":{  //使用$split对params_str字段进行切割,得到params的json格式
                "params": { "$split": ["$params_str", ","] } }
	}
	,
	  {
        "$project": {
            "params": 1,
            // 然后使用$arrayElemAt获得params数组中第三个元素,命名为org
            "org": {
                "$arrayElemAt": [ "$params",2]
            }
        }
    },
			{"$group":{"_id":"$org",count:{$sum:1}} }

    ]
)

查询结果

{
    "_id": " 'org_name': '北京'",
    "count": 3
}

查询弊端就是如果前面包含了多个逗号,切分出来第3个元素就不是org_name这个字段,导致统计不对,需要确保元素格式是一致的,起码前面格式是一致的。

https://blog.csdn.net/qq330983778/article/details/106698094


版权声明:本文为Deng_7788原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。