读书笔记：NOSQL 菜鸟教程

2023年5月30日 304次阅读来源: 炒饭大师

读书笔记：NOSQL 菜鸟教程

定义

NoSQL(NoSQL = Not Only SQL )，意即”不仅仅是SQL”。
NoSQL用于超大规模数据的存储。（例如谷歌或Facebook每天为他们的用户收集万亿比特的数据）。这些类型的数据存储不需要固定的模式，无需多余操作就可以横向扩展。

关系型数据库遵循ACID规则

事务在英文中是transaction，和现实世界中的交易很类似，它有如下四个特性：
A (Atomicity) 原子性、C (Consistency) 一致性、I (Isolation) 独立性、D (Durability) 持久性

RDBMS vs NoSQL

RDBMS *

高度组织化结构化数据
结构化查询语言（SQL） (SQL)
数据和关系都存储在单独的表中。
数据操纵语言，数据定义语言
严格的一致性
基础事务

NoSQL *

代表着不仅仅是SQL
没有声明性查询语言
没有预定义的模式
-键 – 值对存储，列存储，文档存储，图形数据库
最终一致性，而非ACID属性
非结构化和不可预知的数据
CAP定理：CAP理论的核心是：一个分布式系统不可能同时很好的满足一致性，可用性和分区容错性这三个需求，最多只能同时较好的满足两个。
高性能，高可用性和可伸缩性

NoSQL的优点/缺点

优点:

高可扩展性
分布式计算
低成本
架构的灵活性，半结构化数据
没有复杂的关系
缺点:
没有标准化
有限的查询功能（到目前为止）
最终一致是不直观的程序

BASE

BASE是NoSQL数据库通常对可用性及一致性的弱要求原则:
Basically Availble –基本可用
Soft-state –软状态/柔性事务。 “Soft state” 可以理解为”无连接”的, 而 “Hard state” 是”面向连接”的
Eventual Consistency –最终一致性最终一致性，也是是 ACID 的最终目的
文档存储
MongoDB
CouchDB
文档存储一般用类似json的格式存储，存储的内容是文档型的。这样也就有有机会对某些字段建立索引，实现关系数据库的某些功能。
key-value存储
Tokyo Cabinet / Tyrant
Berkeley DB
MemcacheDB
Redis
可以通过key快速查询到其value。一般来说，存储不管value的格式，照单全收。（Redis包含了其他功能）

语法

连接

”’ mongodb://[username:password@]host1[:port1][,host2[:port2],…[,hostN[:portN]]][/[database][?options]] ”’

创建数据库

use DATABASE_NAME 如果数据库不存在，则创建数据库，否则切换到指定数据库。
db 当前数据库
show dbs 所有数据库
db.runoob.insert({“name”:”菜鸟教程”})

删除数据库

db.dropDatabase() 删除当前数据库

删除集合

db.collection.drop() 用法：db.site.drop()
show tables 显示所有集合

插入文档

db.COLLECTION_NAME.insert(document)
db.col.save(document) 如果不指定 _id 字段 save() 方法类似于 insert() 方法。如果指定 _id 字段，则会更新该 _id 的数据。
db.col.find() 查看已插入文档

update()方法

db.collection.update(<query>,<update>,{upsert: <boolean>,multi: <boolean>,
writeConcern: <document>})

save()方法

db.collection.save(<document>,{writeConcern: <document>}) save() 方法通过传入的文档来替换已有文档

删除文档

db.collection.remove(<query>, <justOne>) justOne : （可选）如果设为 true 或 1，则只删除一个文档。

查询文档

db.collection.find(query, projection)

projection ：可选，使用投影操作符指定返回的键。查询时返回文档中所有键值，只需省略该参数即可（默认省略）。
若不指定 projection，则默认返回所有键，指定 projection 格式如下，有两种模式(两种模式不可混用（因为这样的话无法推断其他键是否应返回))
db.collection.find(query, {title: 1, by: 1}) // inclusion模式指定返回的键，不返回其他键
db.collection.find(query, {title: 0, by: 0}) // exclusion模式指定不返回的键,返回其他键

db.col.find().pretty() pretty() 方法以格式化的方式来显示所有文档。
操作
格式
范例
RDBMS中的类似语句
等于
{<key>:<value>}
db.col.find({“by”:”菜鸟教程”}).pretty()
where by = ‘菜鸟教程’
小于
{<key>:{$lt:<value>}}
db.col.find({“likes”:{$lt:50}}).pretty()
where likes < 50
小于或等于
{<key>:{$lte:<value>}}
db.col.find({“likes”:{$lte:50}}).pretty()
where likes <= 50
大于
{<key>:{$gt:<value>}}
db.col.find({“likes”:{$gt:50}}).pretty()
where likes > 50
大于或等于
{<key>:{$gte:<value>}}
db.col.find({“likes”:{$gte:50}}).pretty()
where likes >= 50
不等于
{<key>:{$ne:<value>}}
db.col.find({“likes”:{$ne:50}}).pretty()
where likes != 50

MongoDB AND 条件

db.col.find( {key1:value1, key2:value2} ).pretty()

MongoDB OR 条件

db.col.find({ $or: [{key1: value1}, {key2:value2}] }).pretty()

AND 和 OR 联合使用

db.col.find({“likes”: {$gt:50}, $or: [{“by”: “菜鸟教程”},{“title”: “MongoDB 教程”}]}).pretty()

MongoDB 操作符

$gt ——– greater than >
$gte ——— gt equal >=
$lt ——– less than <
$lte ——— lt equal <=
$ne ———– not equal !=
$eq ——– equal =

$type 操作符

db.col.find({“title” : {$type : 2}})

Double
1

String
2

Object
3

Array
4

Binary data
5

Undefined
6
已废弃。
Object id
7

Boolean
8

Date
9

Null
10

Regular Expression
11

JavaScript
13

Symbol
14

JavaScript (with scope)
15

32-bit integer
16

Timestamp
17

64-bit integer
18

Min key
255
Query with -1.
Max key
127

MongoDB Limit() 方法

db.COLLECTION_NAME.find().limit(NUMBER)

MongoDB Skip() 方法

db.COLLECTION_NAME.find().skip(NUMBER).limit(NUMBER)

当查询时同时使用sort,skip,limit，无论位置先后，最先执行顺序 sort再skip再limit。 *
补充说明skip和limit方法只适合小数据量分页，如果是百万级效率就会非常低，因为skip方法是一条条数据数过去的，建议使用where_limit

MongoDB sort()方法

db.COLLECTION_NAME.find().sort({KEY:1})

MongoDB 索引

db.COLLECTION_NAME.ensureIndex({KEY:1}) 语法中 Key 值为你要创建的索引字段，1为指定按升序创建索引，如果你想按降序来创建索引指定为-1即可。

ensureIndex() 接收可选参数，可选参数列表如下：
（db.values.ensureIndex({open: 1, close: 1}, {background: true})）
Parameter
Type
Description
background
Boolean
建索引过程会阻塞其它数据库操作，background可指定以后台方式创建索引，即增加 “background” 可选参数。 “background” 默认值为false。
unique
Boolean
建立的索引是否唯一。指定为true创建唯一索引。默认值为false.
name
string
索引的名称。如果未指定，MongoDB的通过连接索引的字段名和排序顺序生成一个索引名称。
dropDups
Boolean
在建立唯一索引时是否删除重复记录,指定 true 创建唯一索引。默认值为 false.
sparse
Boolean
对文档中不存在的字段数据不启用索引；这个参数需要特别注意，如果设置为true的话，在索引字段中不会查询出不包含对应字段的文档.。默认值为 false.
expireAfterSeconds
integer
指定一个以秒为单位的数值，完成 TTL设定，设定集合的生存时间。
v
index version
索引的版本号。默认的索引版本取决于mongod创建索引时运行的版本。
weights
document
索引权重值，数值在 1 到 99,999 之间，表示该索引相对于其他索引字段的得分权重。
default_language
string
对于文本索引，该参数决定了停用词及词干和词器的规则的列表。默认为英语
language_override
string
对于文本索引，该参数指定了包含在文档中的字段名，语言覆盖默认的language，默认值为 language.

MongoDB 聚合

db.COLLECTION_NAME.aggregate(AGGREGATE_OPERATION)
db.mycol.aggregate([{$group : {_id : “$by_user”, num_tutorial : {$sum : 1}}}])

    原文作者：炒饭大师
    原文地址: https://www.jianshu.com/p/be838d819359
    本文转自网络文章，转载此文章仅为分享知识，如有侵权，请联系博主进行删除。