Cloud Database Options Compared: Relational, NoSQL, Data Warehouse Cheatsheet

Introduction to Cloud Database Solutions

Cloud database services provide flexible, scalable, and managed data storage solutions without the overhead of maintaining physical infrastructure. They come in various types optimized for different workloads, data structures, and use cases. This cheatsheet compares the three main categories of cloud database options—relational databases, NoSQL databases, and data warehouses—providing guidance on when to use each type, their strengths and limitations, and popular vendor offerings to help you make informed decisions for your data architecture.

Core Database Concepts and Terminology

Key Database Properties

Property	Description	Importance
Scalability	Ability to handle growing data and user loads	Determines performance under increased demand
Availability	Uptime and accessibility of the database	Critical for business continuity
Consistency	Ensuring data validity across transactions	Affects data reliability and integrity
Durability	Ensuring data permanence once stored	Protects against data loss
Performance	Speed of queries and operations	Impacts application responsiveness
Security	Protection against unauthorized access	Safeguards sensitive information
Cost	Pricing model and resource efficiency	Affects total cost of ownership

CAP Theorem Explained

The CAP theorem states that a distributed database system can only guarantee two of three properties simultaneously:

Consistency: All nodes see the same data at the same time
Availability: The system remains operational even when nodes fail
Partition Tolerance: The system continues to function despite network partitions

Most cloud databases make different trade-offs among these properties:

Relational databases typically prioritize consistency and availability
NoSQL databases often prioritize availability and partition tolerance
Data warehouses generally prioritize consistency and partition tolerance

Relational Database Services in the Cloud

Key Characteristics

Based on relational data model with tables, rows, and columns
ACID compliance (Atomicity, Consistency, Isolation, Durability)
SQL as the standard query language
Schema-based with predefined structure
Strong referential integrity through foreign keys and constraints

Best Use Cases

Transactional systems (OLTP)
Applications requiring complex queries and joins
Systems with well-defined, stable schemas
Financial applications requiring transaction guarantees
Applications with complex relationships between data entities

Common Scaling Approaches

Vertical scaling: Adding more resources to a single node
Read replicas: Distributing read queries across multiple instances
Sharding: Partitioning data across multiple database instances
Multi-region deployment: Replicating databases across geographic regions

Major Cloud Relational Database Services

Service	Provider	Key Features	Performance Characteristics	Best For
Amazon RDS	AWS	Multi-AZ deployment, read replicas, automated backups	Good general performance, predictable	General purpose applications
Aurora	AWS	MySQL/PostgreSQL compatible, distributed architecture	High performance, auto-scaling storage	High-performance OLTP
Azure SQL Database	Microsoft	Intelligent performance, advanced security	Consistent performance, auto-tuning	Microsoft stack integration
Cloud SQL	Google	MySQL, PostgreSQL, SQL Server compatibility	Reliable performance, integrated with GCP	GCP ecosystem applications
AlloyDB	Google	PostgreSQL-compatible, AI workload optimized	Very high performance for hybrid workloads	AI-enhanced PostgreSQL applications
Spanner	Google	Global distribution, strong consistency, horizontal scaling	Excellent for global applications	Globally distributed applications

NoSQL Database Services in the Cloud

Key Characteristics

Non-relational data models
Schema-flexible designs
Horizontal scalability
Eventually consistent (in many cases)
Specialized for specific data patterns

NoSQL Database Types

Document Databases

Store data in flexible JSON-like documents
Best for: Content management, user profiles, semi-structured data
Examples: MongoDB Atlas, AWS DocumentDB, Azure Cosmos DB, Firestore

Key-Value Stores

Simple key-value pair storage with high performance
Best for: Caching, session management, real-time data
Examples: Redis, Amazon DynamoDB, Azure Cache for Redis

Wide-Column Stores

Store data in column families optimized for queries over large datasets
Best for: Time-series data, IoT, large-scale analytics
Examples: Cassandra, Google Bigtable, Azure Cosmos DB with Cassandra API

Graph Databases

Optimize storage and querying of highly connected data
Best for: Social networks, recommendation engines, fraud detection
Examples: Neo4j AuraDB, Amazon Neptune, Azure Cosmos DB with Gremlin API

Major Cloud NoSQL Database Services

Service	Provider	Type	Key Features	Scaling Model	Best Use Cases
DynamoDB	AWS	Key-value, Document	Auto-scaling, millisecond latency, serverless	Automatic, pay-per-request	High-scale applications, serverless backends
DocumentDB	AWS	Document (MongoDB compatible)	MongoDB workload migration	Cluster-based	MongoDB migrations, document-oriented applications
Cosmos DB	Azure	Multi-model	Multiple consistency models, global distribution	Automatic, multi-region	Global applications, multiple data models
Firestore	Google	Document	Real-time updates, offline mode	Automatic	Mobile and web apps, real-time collaboration
Bigtable	Google	Wide-column	High throughput, low latency	Manual, node-based	Time-series data, IoT, analytical workloads
MongoDB Atlas	MongoDB	Document	Full MongoDB compatibility, auto-scaling	Automatic, tiered	MongoDB native applications
Redis Cloud	Redis	Key-value	In-memory, data structures	Cluster-based	Caching, real-time analytics, messaging

Data Warehouse Services in the Cloud

Key Characteristics

Optimized for analytical queries and reporting (OLAP)
Columnar storage for efficient aggregation and analysis
Massive parallel processing (MPP) architecture
Separation of storage and compute
Designed for high-volume data processing

Common Features

SQL compatibility for analytics
Integration with BI and visualization tools
ETL/ELT pipeline support
JSON and semi-structured data support
Machine learning integration
Temporal data analysis

Major Cloud Data Warehouse Services

Service	Provider	Architecture	Performance	Cost Model	Key Differentiators
Redshift	AWS	MPP, cluster-based	High performance for complex queries	Instance-based, storage separate	Tight AWS integration, Redshift Spectrum for data lake queries
Snowflake	Independent	Multi-cluster, shared data	Very high, automatic scaling	Consumption-based, storage separate	Multi-cloud, data sharing, separated storage/compute
BigQuery	Google	Serverless, distributed	Excellent for large-scale analytics	Query-based pricing, auto-scaling	Serverless, ML integration, streaming inserts
Synapse Analytics	Azure	MPP, integrated with Spark	Good for mixed workloads	DTU or vCore-based	Azure ecosystem integration, hybrid transactional/analytical
Databricks	Independent	Lakehouse architecture	Excellent for data engineering	Compute-time based	Unified analytics platform, Delta Lake

Data Lakehouse Emerging Trend

Combines elements of data lakes and data warehouses
Open table formats (Delta Lake, Iceberg, Hudi)
ACID transactions on data lakes
Schema enforcement and governance
Direct querying of raw data
Examples: Databricks Lakehouse Platform, Amazon Redshift Spectrum with S3, Google BigLake

Comparative Analysis

Performance Characteristics

Database Type	Read Performance	Write Performance	Query Complexity	Latency	Throughput
Relational	Good for indexed data	Medium to high (ACID overhead)	Excellent (complex joins)	Medium	Medium
NoSQL Document	Very good for document retrieval	Very good	Limited (no joins)	Low	High
NoSQL Key-Value	Excellent for key lookups	Excellent	Very limited (key access)	Very low	Very high
NoSQL Wide-Column	Excellent for column retrieval	Good	Good for analytical queries	Low	Very high
NoSQL Graph	Excellent for relationship queries	Medium	Excellent for connected data	Medium	Medium
Data Warehouse	Excellent for analytical queries	Poor for single-row inserts, good for batch	Excellent (complex analytics)	High	High for analytics

Scaling and Availability Comparison

Database Type	Horizontal Scaling	Vertical Scaling	Multi-Region Support	High Availability Options
Relational	Limited (sharding complex)	Excellent	Available but complex	Multi-AZ, read replicas
NoSQL Document	Excellent	Good	Native in many services	Automatic in managed services
NoSQL Key-Value	Excellent	Good	Often built-in	Usually automatic
NoSQL Wide-Column	Excellent	Limited value	Built-in for many	Usually automatic
NoSQL Graph	Varies by implementation	Good	Varies by service	Varies by service
Data Warehouse	Excellent (MPP architecture)	Good	Available in premium tiers	Built-in redundancy

Cost Structure Comparison

Database Type	Pricing Model	Cost Drivers	Cost Optimization Strategies
Relational	Instance-based + storage	Instance size, storage, I/O	Right-sizing, reserved instances
NoSQL Document	Throughput or request-based	Read/write capacity, storage	Capacity planning, auto-scaling
NoSQL Key-Value	Throughput or request-based	Provisioned capacity, storage	Auto-scaling, caching patterns
NoSQL Wide-Column	Node-based + storage	Node count, storage	Right-sizing, data compression
NoSQL Graph	Instance or request-based	Query complexity, data volume	Query optimization, indexing
Data Warehouse	Compute time or query-based	Compute usage, storage, queries	Workload management, partitioning

Common Database Challenges and Solutions

Data Migration Challenges

Challenge	Relational Solution	NoSQL Solution	Data Warehouse Solution
Schema changes	Schema migration tools, versioning	Schema-flexible by design	ELT with transformation layers
Large data volumes	Batched migration, logical replication	Streaming imports, incremental loading	Bulk loading, partitioning
Minimal downtime	Dual-write patterns, CDC	Eventual consistency models	Separate migration from production
Data consistency	Transaction boundaries, checkpoints	Idempotent operations	Staging areas with validation

Security Implementation

Security Feature	Relational Approach	NoSQL Approach	Data Warehouse Approach
Access control	Role-based (RBAC), row-level security	API keys, IAM integration	Column-level security, data masking
Encryption	TDE, SSL/TLS connections	Encryption at rest and in transit	End-to-end encryption, BYOK
Auditing	SQL audit logs	API call logging	Comprehensive query logging
Network security	VPC/VNET isolation, IP restrictions	Service endpoints, private links	Network ACLs, private endpoints

Operational Best Practices

Practice Area	Relational Recommendations	NoSQL Recommendations	Data Warehouse Recommendations
Monitoring	Query performance, connection pools, locks	Throttling, partition metrics	Query execution plans, resource utilization
Backup strategy	Point-in-time recovery, automated backups	Continuous backups, cross-region replication	Snapshot-based backups, disaster recovery
Performance tuning	Index optimization, query analysis	Access pattern design, partition strategy	Workload management, materialized views
Cost optimization	Reserved instances, right-sizing	On-demand scaling, TTL for data	Compute scheduling, data partitioning

Decision Framework: Choosing the Right Database

Selection Criteria Checklist

[ ] Data structure requirements (structured vs. semi-structured)
[ ] Consistency requirements (ACID vs. eventual consistency)
[ ] Query patterns (transactional vs. analytical)
[ ] Scaling requirements (vertical vs. horizontal)
[ ] Development speed and flexibility needs
[ ] Geographic distribution requirements
[ ] Budget constraints and pricing preferences
[ ] Team expertise and familiarity

Common Solution Patterns

Polyglot Persistence

Using multiple database types for different aspects of an application
Example: Relational for transactions, NoSQL for user profiles, data warehouse for analytics

CQRS (Command Query Responsibility Segregation)

Separating read and write operations
Example: Write to relational database, replicate to NoSQL for fast reads

Hybrid Transactional/Analytical Processing (HTAP)

Systems combining OLTP and OLAP capabilities
Example: Azure Synapse, AlloyDB, Spanner

Micro-service Database Pattern

Each service owns its data and can choose appropriate database
Example: Order service using relational, product catalog using document store

Cloud Database Implementation Strategies

Multi-Cloud Considerations

Benefits: Vendor redundancy, best-of-breed selection
Challenges: Data synchronization, operational complexity
Solutions: Database abstraction layers, data replication services

Migration Paths

On-premises to cloud: Lift-and-shift, re-platforming, re-architecting
Between cloud vendors: Homogeneous or heterogeneous migration
Between database types: Schema conversion, data transformation

Hybrid Cloud Scenarios

Extending on-premises databases to cloud
Disaster recovery configurations
Development/testing in cloud with production on-premises

Popular Database Service Combinations

Scenario	Recommended Combination	Rationale
E-commerce platform	MySQL/PostgreSQL + Elasticsearch + Redis	Transactions, search capability, caching
IoT application	Time-series database + data warehouse	High-volume data ingest, analytical processing
Content management	Document database + search service	Flexible schema, full-text search
Social network	Graph database + document store	Relationship queries, content storage
Financial system	Relational database + data warehouse	ACID transactions, compliance reporting

Resources for Further Learning

Documentation & Guides

AWS Database Documentation
Google Cloud Database Documentation
Microsoft Azure Data Documentation
Snowflake Documentation
MongoDB University

Books

“Designing Data-Intensive Applications” by Martin Kleppmann
“NoSQL Distilled” by Pramod Sadalage and Martin Fowler
“Database Internals” by Alex Petrov
“Cloud Native Data Center Networking” by Dinesh Dutt

Communities & Forums

Stack Overflow
Database Administrators Stack Exchange
Reddit r/Database
Each cloud provider’s community forums

Training & Certification

AWS Database Specialty Certification
Google Cloud Professional Data Engineer
Azure Data Engineer Associate
Snowflake SnowPro Certification
MongoDB Professional Certification

This cheatsheet provides a comprehensive overview of cloud database options across relational, NoSQL, and data warehouse categories, helping you navigate the complexities of database selection and implementation in modern cloud environments.

Introduction to Cloud Database Solutions

Core Database Concepts and Terminology

Key Database Properties

CAP Theorem Explained

Relational Database Services in the Cloud

Key Characteristics

Best Use Cases

Common Scaling Approaches

Major Cloud Relational Database Services

NoSQL Database Services in the Cloud

Key Characteristics

NoSQL Database Types

Document Databases

Key-Value Stores

Wide-Column Stores

Graph Databases

Major Cloud NoSQL Database Services

Data Warehouse Services in the Cloud

Key Characteristics

Common Features

Major Cloud Data Warehouse Services

Data Lakehouse Emerging Trend

Comparative Analysis

Performance Characteristics

Scaling and Availability Comparison

Cost Structure Comparison

Common Database Challenges and Solutions

Data Migration Challenges

Security Implementation

Operational Best Practices

Decision Framework: Choosing the Right Database

Selection Criteria Checklist

Common Solution Patterns

Polyglot Persistence

CQRS (Command Query Responsibility Segregation)

Hybrid Transactional/Analytical Processing (HTAP)

Micro-service Database Pattern

Cloud Database Implementation Strategies

Multi-Cloud Considerations

Migration Paths

Hybrid Cloud Scenarios

Popular Database Service Combinations

Resources for Further Learning

Documentation & Guides

Books

Communities & Forums

Training & Certification

Related Posts