056 Python语法之MongoDB数据库

2023年6月30日 190次阅读来源: Luo_Luo

MongoDB的介绍

MongoDB 是由C++语言编写的，是一个基于分布式文件存储的开源数据库系统
在高负载的情况下，添加更多的节点，可以保证服务器性能
MongoDB 旨在为WEB应用提供可扩展的高性能数据存储解决方案
MongoDB 将数据存储为一个文档，数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档，数组及文档数组

MongoDB一些命令

show dbs：显示所有数据库
db：显示当前数据库
use 数据库：切换(创建)操作的数据库
数据库.数据表.insert({…})：插入一条数据
admin数据库不能操作
可以存储集合(类似字典)
拥有很多数据类型
db.dropDatabase()：删除当前的数据库
show tables：显示当前数据库的数据表
默认端口：27017

命令行进入mongoDB数据库

cd C:\Program Files\MongoDB\Server\3.4\bin
mongo.exe

MongoDB基本概念

SQL术语/概念	MongoDB术语/概念	解释/说明
database	database	数据库
table	collection	数据库表/集合
row	document	数据记录行/文档
column	field	数据字段/域
index	index	索引
table joins	–	表连接,MongoDB不支持
primary key	primary key	主键,MongoDB自动将_id字段设置为主键

文档(行)

RDBMS 与 MongoDB

RDBMS	MongoDB
数据库	数据库
表格	集合
行	文档
列	字段
表联合	嵌入文档
主键	主键 (MongoDB 提供了 key 为 _id )
数据库服务和客户端	–
Mysqld/Oracle	mongod
mysql/sqlplus	mongo

文档需要注意的点

文档中的键/值对是有序的。
文档中的值不仅可以是在双引号里面的字符串，还可以是其他几种数据类型（甚至可以是整个嵌入的文档)。
MongoDB区分类型和大小写。
MongoDB的文档不能有重复的键。
文档的键是字符串。除了少数例外情况，键可以使用任意UTF-8字符。

文档键命名规范

键不能含有\0 (空字符)。这个字符用来表示键的结尾。
.和$有特别的意义，只有在特定环境下才能使用。
以下划线”_”开头的键是保留的(不是严格要求的)。

集合(表)

集合(表)命名规范

集合名不能是空字符串””。
集合名不能含有\0字符（空字符)，这个字符表示集合名的结尾。
集合名不能以”system.”开头，这是为系统集合保留的前缀。
用户创建的集合名字不能含有保留字符。有些驱动程序的确支持在集合名里面包含，这是因为某些系统生成的集合中包含该字符。
除非你要访问这种系统创建的集合，否则千万不要在名字里出现$

固定大小的集合(capped collections)

Capped collections 就是固定大小的collection。
它有很高的性能以及队列过期的特性(过期按照插入的顺序). 有点和 “RRD” 概念类似。
Capped collections是高性能自动的维护对象的插入顺序。它非常适合类似记录日志的功能和标准的collection不同，你必须要显式的创建一个capped collection，指定一个collection的大小，单位是字节。
collection的数据存储空间值提前分配的。
要注意的是指定的存储大小包含了数据库的头信息。
在capped collection中，你能添加新的对象。
能进行更新，然而，对象不会增加存储空间。如果增加，更新就会失败。
数据库不允许进行删除。使用drop()方法删除collection所有的行。
注意: 删除之后，你必须显式的重新创建这个collection。
在32bit机器中，capped collection最大存储为1e9( 1X109)个字节。

元数据

集合命名空间	描述
dbname.system.namespaces	列出所有名字空间。
dbname.system.indexes	列出所有索引。
dbname.system.profile	包含数据库概要(profile)信息。
dbname.system.users	列出所有可访问数据库的用户。
dbname.local.sources	包含复制对端（slave）的服务器信息和状态。

元数据介绍

数据库的信息是存储在集合中。它们使用了系统的命名空间：dbname.system.*
对于修改系统集合中的对象有如下限制。
在{{system.indexes}}插入数据，可以创建索引。但除此之外该表信息是不可变的(特殊的drop index命令将自动更新相关信息)。
{{system.users}}是可修改的。 {{system.profile}}是可删除的。

MongoDB数据类型

数据类型	描述
String	字符串。存储数据常用的数据类型。在 MongoDB 中，UTF-8 编码的字符串才是合法的。
Integer	整型数值。用于存储数值。根据你所采用的服务器，可分为 32 位或 64 位。
Boolean	布尔值。用于存储布尔值（真/假）。
Double	双精度浮点值。用于存储浮点值。
Min/Max keys	将一个值与 BSON（二进制的 JSON）元素的最低值和最高值相对比。
Arrays	用于将数组或列表或多个值存储为一个键。
Timestamp	时间戳。记录文档修改或添加的具体时间。
Object	用于内嵌文档。
Null	用于创建空值。
Symbol	符号。该数据类型基本上等同于字符串类型，但不同的是，它一般用于采用特殊符号类型的语言。
Date	日期时间。用 UNIX 时间格式来存储当前日期或时间。你可以指定自己的日期时间：创建 Date 对象，传入年月日信息。
Object ID	对象 ID。用于创建文档的 ID。
Binary Data	二进制数据。用于存储二进制数据。
Code	代码类型。用于在文档中存储 JavaScript 代码。
Regular expression	正则表达式类型。用于存储正则表达式。

创建数据库

use DATABASE_NAME：如果数据库不存在，则创建数据库，否则切换到指定数据库
db：查看当前操作的数据库
show dbs：查看所有数据库
db.runoob.insert({“name”:”Luo”})：插入数据

删除数据库

db.dropDatabase()：删除数据库

删除集合(表)

db.COLLECTION_NAME.drop()：例：db.user.drop()：返回true/false

插入文档(数据)

db.COLLECTION.insert(document)：COLLECTION：数据表 document：数据(json)
db.COLLECTION.save(document)：COLLECTION：数据表 document：数据(json)
document可先定义：document=({user:”Luo”,age:23});
db.user.insertOne({user:”hahahaha”,age:233})：插入一条
db.user.insertMany([{user:”hahahaha”,age:233},{user:”hehehehe”,age:322}])：一次性插入多条

更新文档(数据)

更新模板与实例

db.collection.update(
   <query>,     # 查询条件,必须有
   <update>,    # 更新的数据
   {
     upsert: <boolean>,
     multi: <boolean>,  # 是否替换多条数据
     writeConcern: <document>
   }
)

# 替换查找到的第一个
db.user.update(
    {"user":"hahahaha"},
    {$set:{"user":"wangge"}}
)

# 替换多个
db.user.update(
    {"user":"hahahaha"},
    {$set:{"user":"wangge"}},
    {multi:true}
)

只更新第一条记录：
db.col.update( { "count" : { $gt : 1 } } , { $set : { "test2" : "OK"} } );
全部更新：
db.col.update( { "count" : { $gt : 3 } } , { $set : { "test2" : "OK"} },false,true );
只添加第一条：
db.col.update( { "count" : { $gt : 4 } } , { $set : { "test5" : "OK"} },true,false );
全部添加加进去:
db.col.update( { "count" : { $gt : 5 } } , { $set : { "test5" : "OK"} },true,true );
全部更新：
db.col.update( { "count" : { $gt : 15 } } , { $inc : { "count" : 1} },false,true );
只更新第一条记录：
db.col.update( { "count" : { $gt : 10 } } , { $inc : { "count" : 1} },false,false );

更新文档参数介绍

query : update的查询条件，类似sql update查询内where后面的。
update : update的对象和一些更新的操作符（如$,$inc…）等，也可以理解为sql update查询内set后面的
upsert : 可选，这个参数的意思是，如果不存在update的记录，是否插入objNew,true为插入，默认是false，不插入。
multi : 可选，mongodb 默认是false,只更新找到的第一条记录，如果这个参数为true,就把按条件查出来多条记录全部更新。
writeConcern :可选，抛出异常的级别。

删除文档

删除文档模板与实例

db.collection.remove(
   <query>,
   {
     justOne: <boolean>,
     writeConcern: <document>
   }
)

query：(可选)删除的文档的条件。
justOne：(可选)如果设为 true 或 1,则只删除一个文档,不写默认删除所有匹配的数据
writeConcern :（可选）抛出异常的级别

db.collection.remove(DELETION_CRITERIA,1)  # 删除查询到的第一条数据

删除所有数据

db.collection.remove({})

查看文档(数据)

db.collection.find().pretty()：格式化查看
db.collection.findOne()：查看一条，这个不需要加 pretty

查看文档模板与实例

db.collection.find(query, projection)
query ：可选，使用查询操作符指定查询条件
projection ：可选，使用投影操作符指定返回的键。查询时返回文档中所有键值， 只需省略该参数即可（默认省略）
db.col.find().pretty()  # 格式化查看

查询条件对比

操作	格式	范例	RDBMS中的类似语句
等于	{<key>:<value>}	db.col.find({“by”:”菜鸟教程”}).pretty()	where by = ‘菜鸟教程’
小于	{<key>:{$lt:<value>}}	db.col.find({“likes”:{$lt:50}}).pretty()	where likes < 50
小于或等于	{<key>:{$lte:<value>}}	db.col.find({“likes”:{$lte:50}}).pretty()	where likes <= 50
大于	{<key>:{$gt:<value>}}	db.col.find({“likes”:{$gt:50}}).pretty()	where likes > 50
大于或等于	{<key>:{$gte:<value>}}	db.col.find({“likes”:{$gte:50}}).pretty()	where likes >= 50
不等于	{<key>:{$ne:<value>}}	db.col.find({“likes”:{$ne:50}}).pretty()	where likes != 50

AND 条件

db.collection.find({key1:value1, key2:value2}).pretty()
key1 和 key2 联合查询：两个条件都必须满足

OR 条件(记得用中括号)

db.col.find(
   {
      $or: [
         {key1: value1}, {key2:value2}
      ]
   }
).pretty()
key1 和 key2 联合查询：只要有一个满足就行

AND 和 OR 联合使用

db.col.find(
    {
        "likes": {$gt:50}, 
        $or: [
            {"by": "菜鸟教程"},
            {"title": "MongoDB 教程"}
        ]
    }
).pretty()
db.user.remove(
    {
        "user":"Luo",
        $or:[
            {"age":23},
            {"user":"hehehehe"}
        ]
    }
).pretty()

条件操作符

(>) 大于 – $gt
(<) 小于 – $lt
(>=) 大于等于 – $gte
(<= ) 小于等于 – $lte

条件查询模板

db.user.find({age:{$lte:10}}).pretty()

使用 (<) 和 (>) 查询 – $lt 和 $gt

db.user.find(
    {
        age:{
            $gte:10,
            $lte:100
        }
    }
).pretty()

$type 操作符

描述

类型	数字	备注
Double	1	–
String	2	–
Object	3	–
Array	4	–
Binary data	5	–
Undefined	6	已废弃。
Object id	7	–
Boolean	8	–
Date	9	–
Null	10	–
Regular Expression	11	–
JavaScript	13	–
Symbol	14	–
JavaScript (with scope)	15	–
32-bit integer	16	–
Timestamp	17	–
64-bit integer	18	–
Min key	255	Query with -1.
Max key	127	–

查询使用

获取 "col" 集合中 title 为 String 的数据
db.col.find({"title" : {$type : 2}})

Limit与Skip方法

db.col.find().limit(NUMBER) # 限制查询多少条
db.COLLECTION_NAME.find().limit(NUMBER).skip(NUMBER) # 跳过的记录条数

sort()方法

db.COLLECTION_NAME.find().sort({KEY:1}) # 1：升序 2：降序

索引(暂时不懂)

db.COLLECTION_NAME.ensureIndex({KEY:1})
db.values.ensureIndex({key1: value1, key2: value2}, {background: true})

索引可选参数

Parameter	Type	Description
background	Boolean	建索引过程会阻塞其它数据库操作，background可指定以后台方式创建索引，即增加 “background” 可选参数。 “background” 默认值为false。
unique	Boolean	建立的索引是否唯一。指定为true创建唯一索引。默认值为false.
name	string	索引的名称。如果未指定，MongoDB的通过连接索引的字段名和排序顺序生成一个索引名称。
dropDups	Boolean	在建立唯一索引时是否删除重复记录,指定 true 创建唯一索引。默认值为 false.
sparse	Boolean	对文档中不存在的字段数据不启用索引；这个参数需要特别注意，如果设置为true的话，在索引字段中不会查询出不包含对应字段的文档. 默认值为 false.
expireAfterSeconds	integer	指定一个以秒为单位的数值,完成 TTL设定,设定集合的生存时间
v	index version	索引的版本号,默认的索引版本取决于mongod创建索引时运行的版本
weights	document	索引权重值,数值在 1 到 99,999 之间,表示该索引相对于其他索引字段的得分权重
default_language	string	对于文本索引,该参数决定了停用词及词干和词器的规则的列表.默认为英语
language_override	string	对于文本索引,该参数指定了包含在文档中的字段名,语言覆盖默认的language,默认值为 language

聚合

db.mycol.aggregate(
    [
        {
            $group : {_id : "$by_user", num_tutorial : {$sum : 1}}
        }
    ]
)

聚合表达式

表达式	描述	实例
$sum	计算总和	db.mycol.aggregate([{$group : {_id : “$by_user”, num_tutorial : {$sum : “$likes”}}}])
$avg	计算平均值	db.mycol.aggregate([{$group : {_id : “$by_user”, num_tutorial : {$avg : “$likes”}}}])
$min	获取集合中所有文档对应值得最小值。	db.mycol.aggregate([{$group : {_id : “$by_user”, num_tutorial : {$min : “$likes”}}}])
$max	获取集合中所有文档对应值得最大值。	db.mycol.aggregate([{$group : {_id : “$by_user”, num_tutorial : {$max : “$likes”}}}])
$push	在结果文档中插入值到一个数组中。	db.mycol.aggregate([{$group : {_id : “$by_user”, url : {$push: “$url”}}}])
$addToSet	在结果文档中插入值到一个数组中，但不创建副本。	db.mycol.aggregate([{$group : {_id : “$by_user”, url : {$addToSet : “$url”}}}])
$first	根据资源文档的排序获取第一个文档数据。	db.mycol.aggregate([{$group : {_id : “$by_user”, first_url : {$first : “$url”}}}])
$last	根据资源文档的排序获取最后一个文档数据	db.mycol.aggregate([{$group : {_id : “$by_user”, last_url : {$last : “$url”}}}])

管道的概念

$project：修改输入文档的结构。可以用来重命名、增加或删除域，也可以用于创建计算结果以及嵌套文档。
$match：用于过滤数据，只输出符合条件的文档。$match使用MongoDB的标准查询操作。
$limit：用来限制MongoDB聚合管道返回的文档数。
$skip：在聚合管道中跳过指定数量的文档，并返回余下的文档。
$unwind：将文档中的某一个数组类型字段拆分成多条，每条包含数组中的一个值。
$group：将集合中的文档分组，可用于统计结果。
$sort：将输入文档排序后输出。
$geoNear：输出接近某一地理位置的有序文档。

管道例子

match之后的结果往group内进行筛选运算，key非0显示该字段
db.articles.aggregate(
    [
        { 
            $match : { 
                score : { $gt : 70, $lte : 90 } # 匹配条件
            }
        },
        { 
            $group: {
                _id: null,  # 0 或者null为去除_id
                count: {
                    $sum: 1
                } 
            }
        }
    ]
);

综合案例

# 插入三条数据
db.user.insert({title: "MongoDB Overview", user: "Luo",likes: 100})

db.user.insert({title: "MongoDB Overview", user: "wangge",likes: 50})

db.user.insert({title: "MongoDB", user: "wangge",likes: 50})

db.user.insert({title: "MongoDB", user: "wangge",likes: 49})


# 使用user分组,article_count名字可以随便写,sum计算求和
db.user.aggregate([{$group:{_id:"$user",article_count:{$sum:1}}}])

---------结果----------
{ "_id" : "wangge", "article_count" : 2 }
{ "_id" : "Luo", "article_count" : 1 }


# 求$likes的平均值
db.user.aggregate([{$group:{_id:"$user",article_count:{$avg:"$likes"}}}])

---------结果----------
{ "_id" : "wangge", "article_count" : 50 }
{ "_id" : "Luo", "article_count" : 100 }


# 求likes的最大值
db.user.aggregate([{$group:{_id:"$user",article_count:{$max:"$likes"}}}])

---------结果----------
{ "_id" : "wangge", "article_count" : 50 }
{ "_id" : "Luo", "article_count" : 100 }


# 将该值的返回值都当做一个数组返回
db.user.aggregate([{$group:{_id:"$user",article_count:{$push:"$likes"}}}])

---------结果----------
{ "_id" : "wangge", "article_count" : [ 50, 50 ] }
{ "_id" : "Luo", "article_count" : [ 100 ] }


# 去重复，然后将返回值都当做一个数组返回
db.user.aggregate([{$group:{_id:"$user",article_count:{$addToSet:"$likes"}}}])

---------结果----------
{ "_id" : "wangge", "article_count" : [ 49, 50 ] }
{ "_id" : "Luo", "article_count" : [ 100 ] }


# 拿到数据的第一个
db.user.aggregate([{$group:{_id:"$user",article_count:{$first:"$likes"}}}])

---------结果----------
{ "_id" : "wangge", "article_count" : 50 }
{ "_id" : "Luo", "article_count" : 100 }


# 拿到数据的最后一个
db.user.aggregate([{$group:{_id:"$user",article_count:{$last:"$likes"}}}])

---------结果----------
{ "_id" : "wangge", "article_count" : 49 }
{ "_id" : "Luo", "article_count" : 100 }


# $match与$group联合查询
db.user.aggregate([{$match:{likes:{$gt:49,$lt:1000}}},{$group:{_id:"$user",article_count:{$last:"$likes"}}}])

---------结果----------
{ "_id" : "wangge", "article_count" : 50 }
{ "_id" : "Luo", "article_count" : 100 }


# $skip无返回结果，跳过了两条数据 $group $match $push
db.user.aggregate([{$match:{likes:{$gt:48,$lt:1000}}},{$group:{_id:"$user",article_count:{$push:"$likes"}}},{$skip:2}])


# 对结果进行排序likes后面为1则升序，-1则降序 $match $sort
db.user.aggregate([{$match:{likes:{$gt:48,$lt:1000}}},{$sort:{"likes":1}}])

---------结果----------
{"_id":ObjectId("598bf5714c30a699eda1ff0d"), "title" : "MongoDB", "user" : "wangge", "likes" : 49 }

{ "_id" : ObjectId("598bd7854c30a699eda1ff0b"), "title" : "MongoDB Overview", "user" : "wangge", "likes" : 50 }

{ "_id" : ObjectId("598bd78b4c30a699eda1ff0c"), "title" : "MongoDB", "user" : "wangge", "likes" : 50 }

{ "_id" : ObjectId("598bd7764c30a699eda1ff0a"), "title" : "MongoDB Overview", "user" : "Luo", "likes" : 100 }


# 先匹配过滤，然后排序，最后过滤一些数据字段 $project $sort
db.user.aggregate([{$match:{likes:{$gt:48,$lt:1000}}},{$sort:{"likes":1}},{$project:{_id:0,title:1,user:1,likes:1}}])

---------结果----------
{ "title" : "MongoDB", "user" : "wangge", "likes" : 49 }
{ "title" : "MongoDB Overview", "user" : "wangge", "likes" : 50 }
{ "title" : "MongoDB", "user" : "wangge", "likes" : 50 }
{ "title" : "MongoDB Overview", "user" : "Luo", "likes" : 100 }


# 跳过数据 $skip
db.user.aggregate([{$match:{likes:{$gt:48,$lt:1000}}},{$sort:{"likes":1}},{$project:{_id:0,title:1,user:1,likes:1}},{$skip:1}])

---------结果----------
{ "title" : "MongoDB Overview", "user" : "wangge", "likes" : 50 }
{ "title" : "MongoDB", "user" : "wangge", "likes" : 50 }
{ "title" : "MongoDB Overview", "user" : "Luo", "likes" : 100 }


# 限制输出数量 $limit
db.user.aggregate([{$match:{likes:{$gt:48,$lt:1000}}},{$sort:{"likes":1}},{$project:{_id:0,title:1,user:1,likes:1}},{$limit:1}])

---------结果----------
{ "title" : "MongoDB", "user" : "wangge", "likes" : 49 }


# 插入一条数据
db.user.insert({item:"ABCD",size:["S","M","L"]})
# 将文档中的某一个数组类型字段拆分成多条，每条包含数组中的一个值 $unwind
db.user.aggregate([{$unwind:"$size"}])

---------结果----------
{"_id" : ObjectId("598c00824c30a699eda1ff0e"),"item": "ABCD", "size" : "S" }
{"_id" : ObjectId("598c00824c30a699eda1ff0e"),"item": "ABCD", "size" : "M" }
{"_id" : ObjectId("598c00824c30a699eda1ff0e"),"item": "ABCD", "size" : "L" }

拖库(暂未实现)

cmd用管理员权限进入MongoDB\bin目录
执行：mongodump -h 127.0.0.1:27017 test -o C:\Users\Administrator\Desktop

安装pymongo

pip install pymongo-3.4.0-cp36-cp36m-win_amd64.whl

Python实现Mongo操作

# Author：Luo
import pymongo

def get_client():
    client = pymongo.MongoClient(host="127.0.0.1",port=27017)
    return client

client = get_client()   # 获取mongo客户端
db = client["test"] # 拿到test数据库
print(db.collection_names())    #打印所有表名
coll = db["user"]   # 拿到user表

# coll.insert({"name":"hello","age":34})     # 插入数据
# coll.insert([{"name":"hello2","age":34},{"name":"hello3","age":30}])     # 插入多条数据

for line in coll.find():    # 取出所有数据
    print(line)

# print(coll.find_one({"age":30}))    # 找出第一个age为30的数据

# print(coll.find_one_and_delete({"age":30})) # 找到并删除

# print(coll.find_one_and_update({"age":34},{"$set":{"name":"哇哈哈"}}))   # 返回修改之前的那条数据

    原文作者：Luo_Luo
    原文地址: https://www.jianshu.com/p/d3b711344c84
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。