2018年,讓你的數據庫變更快的十個建議
1、小心設計數據庫
第一個技巧也許看來理所當然,但事實上大部分數據庫的問題都來自于設計不好的數據庫結構。
譬如我曾經遇見過將客戶端信息和支付信息儲存在同一個數據庫列中的例子。對于系統和用數據庫的開發者來說,這很糟糕。
新建數據庫時,應當將信息儲存在不同的表里,采用標準的命名方式,并采用主鍵。
來源: http://www.simple-talk.com/sql/database-administration/ten-common-database-design-mistakes/
2、清楚你需要優化的地方
如果你想優化某個查詢語句,清楚的知道這個語句的結果是非常有幫助的。采用 EXPLAIN 語句,你將獲得很多有用的信息,下面來看個例子:
- EXPLAIN SELECT * FROM ref_table,other_table WHERE ref_table.key_column=other_table.column;
來源: http://dev.mysql.com/doc/refman/5.0/en/using-explain.html
3、最快的查詢語句… 是那些你沒發送的語句
每次你向數據庫發送一條語句,你都會用掉很多服務器資源。所以在很高流量的網站中,最好的方法是將你的查詢語句緩存起來。
有許多種緩存語句的方法,下面列出了幾個:
AdoDB: AdoDB 是一個 PHP 的數據庫簡化庫。使用它,你可以選用不同的數據庫系統 (MySQL, PostGreSQL, Interbase 等等),而且它就是為了速度而設計的。AdoDB 提供了簡單但強大的緩存系統。還有,AdoDB 擁有 BSD 許可,你可以在你的項目中免費使用它。對于商業化的項目,它也有 LGPL 許可。
Memcached:Memcached 是一種分布式內存緩存系統,它可以減輕數據庫的負載,來加速基于動態數據庫的網站。
CSQL Cache: CSQL 緩存是一個開源的數據緩存架構。我沒有試過它,但它看起來非常的棒。
4、不要 select 你不需要的
獲取想要的數據,一種非常常見的方式就是采用 * 字符,這會列出所有的列。
- SELECT * FROM wp_posts;
然而,你應該僅列出你需要的列,如下所示。如果在一個非常小型的網站,譬如,一分鐘一個用戶訪問,可能沒有什么分別。然而如果像 Cats Who Code 這樣大流量的網站,這就為數據庫省了很多事。
- SELECT title, excerpt, author FROM wp_posts;
5、采用 LIMIT
僅獲得某個特定行數的數據是非常常見的。譬如博客每頁只顯示十篇文章。這時,你應該使用 LIMIT,來限定你想選定的數據的行數。
如果沒有 LIMIT,表有 100,000 行數據,你將會遍歷所有的行數,這對于服務器來說是不必要的負擔。
- SELECT title, excerpt, author FROM wp_posts LIMIT 10;
6、避免循環中的查詢
當在 PHP 中使用 SQL 時,可以將 SQL 放在循環語句中。但這么做給你的數據庫增加了負擔。
下面的例子說明了 “在循環語句中嵌套查詢語句” 的問題:
- foreach ($display_order as $id => $ordinal){
- $sql = "UPDATE categories SET display_order = $ordinal WHERE id = $id";
- mysql_query($sql);
- }
你可以這么做:
- UPDATE categories
- SET display_order = CASE id
- WHEN 1 THEN 3
- WHEN 2 THEN 4
- WHEN 3 THEN 5
- END WHERE id IN (1,2,3)
來源: http://www.karlrixon.co.uk/articles/sql/update-multiple-rows-with-different-values-and-a-single-sql-query/
7、采用 join 來替換子查詢
程序員可能會喜歡用子查詢,甚至濫用。下面的子查詢非常有用:
- SELECT a.id,
- (SELECT MAX(created)
- FROM posts
- WHERE author_id = a.id)
- AS latest_post FROM authors a
雖然子查詢很有用,但 join 語句可以替換它,join 語句執行起來更快。
- SELECT a.id, MAX(p.created) AS latest_post
- FROM authors a
- INNER JOIN posts p
- ON (a.id = p.author_id)
- GROUP BY a.id
來源: http://20bits.com/articles/10-tips-for-optimizing-mysql-queries-that-dont-suck/
8、小心使用通配符
通配符非常好用,在搜索數據的時候可以用通配符來代替一個或多個字符。我不是說不能用,而是,應該小心使用,并且不要使用全詞通配符 (full wildcard),前綴通配符或后置通配符可以完成相同的任務。
事實上,在百萬數量級的數據上采用全詞通配符來搜索會讓你的數據庫當機。
- #Full wildcard
- SELECT * FROM TABLE WHERE COLUMN LIKE '%hello%'; #Postfix wildcard
- SELECT * FROM TABLE WHERE COLUMN LIKE 'hello%'; #Prefix wildcard
- SELECT * FROM TABLE WHERE COLUMN LIKE '%hello';
來源: http://hungred.com/useful-information/ways-optimize-sql-queries/
9、采用 UNION 來代替 OR
下面的例子采用 OR 語句來:
- SELECT * FROM a, b WHERE a.p = b.q or a.x = b.y;
UNION 語句,你可以將 2 個或更多 select 語句的結果拼在一起。下面的例子返回的結果同上面的一樣,但是速度要快些:
- SELECT * FROM a, b WHERE a.p = b.q
- UNION
- SELECT * FROM a, b WHERE a.x = b.y
來源: http://www.bcarter.com/optimsql.htm
10. 使用索引
數據庫索引和你在圖書館中見到的索引類似:能讓你更快速的獲取想要的信息,正如圖書館中的索引能讓讀者更快的找到想要的書一樣。
可以在一個列上創建索引,也可以在多個列上創建。索引是一種數據結構,它將表中的一列或多列的值以特定的順序組織起來。
下面的語句在 Product 表的 Model 列上創建索引。這個索引的名字叫作 idxModel
- CREATE INDEX idxModel ON Product (Model);
責任編輯:售電衡衡
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業
-
碳中和戰略|趙英民副部長致辭全文
2020-10-19碳中和,碳排放,趙英民 -
深度報告 | 基于分類監管與當量協同的碳市場框架設計方案
2020-07-21碳市場,碳排放,碳交易 -
碳市場讓重慶能源轉型與經濟發展并進
2020-07-21碳市場,碳排放,重慶
-
兩部門:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
國家發改委、國家能源局:推廣不停電作業技術 減少停電時間和停電次數
2020-09-28獲得電力,供電可靠性,供電企業 -
2020年二季度福建省統調燃煤電廠節能減排信息披露
2020-07-21火電環保,燃煤電廠,超低排放
-
四川“專線供電”身陷違法困境
2019-12-16專線供電 -
我國能源替代規范法律問題研究(上)
2019-10-31能源替代規范法律 -
區域鏈結構對于數據中心有什么影響?這個影響是好是壞呢!