當前位置: 首頁編程開發(fā)PHP → PHP中常見數據庫問題及解決方法

PHP中常見數據庫問題及解決方法

更多
本文提到了關于PHP應用程序中的五個常見數據庫問題,包括有數據庫模式設計、數據庫訪問和使用數據庫的業(yè)務邏輯代碼,以及教大家如何去解決這類問題,希望對大家有所幫助。

  如果只有一種 方式使用數據庫是正確的……

  您可以用很多的方式創(chuàng)建數據庫設計、數據庫訪問和基于數據庫的 PHP 業(yè)務邏輯代碼,但最終一般以錯誤告終。本文說明了數據庫設計和訪問數據庫的 PHP 代碼中出現的五個常見問題,以及在遇到這些問題時如何修復它們。

  問題 1:直接使用 MySQL

  一個常見問題是較老的 PHP 代碼直接使用 mysql_ 函數來訪問數據庫。清單 1 展示了如何直接訪問數據庫。

  清單 1. access/get.php

 

<?php
function get_user_id( $name )
{
 $db = mysql_connect( 'localhost', 'root', 'password' );
 mysql_select_db( 'users' );

 $res = mysql_query( "SELECT id FROM users WHERE login='".$name."'" );
 while( $row = mysql_fetch_array( $res ) ) { $id = $row[0]; }

 return $id;
}

var_dump( get_user_id( 'jack' ) );
?>


  注意使用了 mysql_connect 函數來訪問數據庫。還要注意查詢,其中使用字符串連接來向查詢添加 $name 參數。

  該技術有兩個很好的替代方案:PEAR DB 模塊和 PHP Data Objects (PDO) 類。兩者都從特定數據庫選擇提供抽象。因此,您的代碼無需太多調整就可以在 IBM? DB2?、MySQL、PostgreSQL 或者您想要連接到的任何其他數據庫上運行。

  使用 PEAR DB 模塊和 PDO 抽象層的另一個價值在于您可以在 SQL 語句中使用 ? 操作符。這樣做可使 SQL 更加易于維護,且可使您的應用程序免受 SQL 注入攻擊。

  使用 PEAR DB 的替代代碼如下所示。

  清單 2. Access/get_good.php

 

<?php
require_once("DB.php");

function get_user_id( $name )
{
 $dsn = 'mysql://root:password@localhost/users';
 $db =& DB::Connect( $dsn, array() );
 if (PEAR::isError($db)) { die($db->getMessage()); }

 $res = $db->query( 'SELECT id FROM users WHERE login=?',array( $name ) );
 $id = null;
 while( $res->fetchInto( $row ) ) { $id = $row[0]; }

 return $id;
}

var_dump( get_user_id( 'jack' ) );
?>


  注意,所有直接用到 MySQL 的地方都消除了,只有 $dsn 中的數據庫連接字符串除外。此外,我們通過 ? 操作符在 SQL 中使用 $name 變量。然后,查詢的數據通過 query() 方法末尾的 array 被發(fā)送進來。

  問題 2:不使用自動增量功能

  與大多數現代數據庫一樣,MySQL 能夠在每記錄的基礎上創(chuàng)建自動增量惟一標識符。除此之外,我們仍然會看到這樣的代碼,即首先運行一個 SELECT 語句來找到最大的 id,然后將該 id 增 1,并找到一個新記錄。清單 3 展示了一個示例壞模式。

  清單 3. Badid.sql

 

DROP TABLE IF EXISTS users;
CREATE TABLE users (
id MEDIUMINT,
login TEXT,
password TEXT
);

INSERT INTO users VALUES ( 1, 'jack', 'pass' );
INSERT INTO users VALUES ( 2, 'joan', 'pass' );
INSERT INTO users VALUES ( 1, 'jane', 'pass' );


  這里的 id 字段被簡單地指定為整數。所以,盡管它應該是惟一的,我們還是可以添加任何值,如 CREATE 語句后面的幾個 INSERT 語句中所示。清單 4 展示了將用戶添加到這種類型的模式的 PHP 代碼。

  清單 4. Add_user.php

 

<?php
require_once("DB.php");

function add_user( $name, $pass )
{
 $rows = array();

 $dsn = 'mysql://root:password@localhost/bad_badid';
 $db =& DB::Connect( $dsn, array() );
 if (PEAR::isError($db)) { die($db->getMessage()); }

 $res = $db->query( "SELECT max(id) FROM users" );
 $id = null;
 while( $res->fetchInto( $row ) ) { $id = $row[0]; }

 $id += 1;

 $sth = $db->prepare( "INSERT INTO users VALUES(?,?,?)" );
 $db->execute( $sth, array( $id, $name, $pass ) );

 return $id;
}

$id = add_user( 'jerry', 'pass' );

var_dump( $id );
?>


  add_user.php 中的代碼首先執(zhí)行一個查詢以找到 id 的最大值。然后文件以 id 值加 1 運行一個 INSERT 語句。該代碼在負載很重的服務器上會在競態(tài)條件中失敗。另外,它也效率低下。

  那么替代方案是什么呢?使用 MySQL 中的自動增量特性來自動地為每個插入創(chuàng)建惟一的 ID。更新后的模式如下所示。

  清單 5. Goodid.php

 

DROP TABLE IF EXISTS users;
CREATE TABLE users (
 id MEDIUMINT NOT NULL AUTO_INCREMENT,
 login TEXT NOT NULL,
 password TEXT NOT NULL,
 PRIMARY KEY( id )
);

INSERT INTO users VALUES ( null, 'jack', 'pass' );
INSERT INTO users VALUES ( null, 'joan', 'pass' );
INSERT INTO users VALUES ( null, 'jane', 'pass' );


  我們添加了 NOT NULL 標志來指示字段必須不能為空。我們還添加了 AUTO_INCREMENT 標志來指示字段是自動增量的,添加 PRIMARY KEY 標志來指示那個字段是一個 id。這些更改加快了速度。清單 6 展示了更新后的 PHP 代碼,即將用戶插入表中。

  清單 6. Add_user_good.php

 

<?php
require_once("DB.php");

function add_user( $name, $pass )
{
 $dsn = 'mysql://root:password@localhost/good_genid';
 $db =& DB::Connect( $dsn, array() );
 if (PEAR::isError($db)) { die($db->getMessage()); }

 $sth = $db->prepare( "INSERT INTO users VALUES(null,?,?)" );
 $db->execute( $sth, array( $name, $pass ) );

 $res = $db->query( "SELECT last_insert_id()" );
 $id = null;
 while( $res->fetchInto( $row ) ) { $id = $row[0]; }

 return $id;
}

$id = add_user( 'jerry', 'pass' );

var_dump( $id );
?>


  現在我不是獲得最大的 id 值,而是直接使用 INSERT 語句來插入數據,然后使用 SELECT 語句來檢索最后插入的記錄的 id。該代碼比最初的版本及其相關模式要簡單得多,且效率更高。

  問題 3:使用多個數據庫

  偶爾,我們會看到一個應用程序中,每個表都在一個單獨的數據庫中。在非常大的數據庫中這樣做是合理的,但是對于一般的應用程序,則不需要這種級別的分割。此外,不能跨數據庫執(zhí)行關系查詢,這會影響使用關系數據庫的整體思想,更不用說跨多個數據庫管理表會更困難了。 那么,多個數據庫應該是什么樣的呢?首先,您需要一些數據。清單 7 展示了分成 4 個文件的這樣的數據。

  清單 7. 數據庫文件

 

Files.sql:
CREATE TABLE files (
 id MEDIUMINT,
 user_id MEDIUMINT,
 name TEXT,
 path TEXT
);

Load_files.sql:
INSERT INTO files VALUES ( 1, 1, 'test1.jpg', 'files/test1.jpg' );
INSERT INTO files VALUES ( 2, 1, 'test2.jpg', 'files/test2.jpg' );

Users.sql:
DROP TABLE IF EXISTS users;
CREATE TABLE users (
 id MEDIUMINT,
 login TEXT,
 password TEXT
);

Load_users.sql:
INSERT INTO users VALUES ( 1, 'jack', 'pass' );
INSERT INTO users VALUES ( 2, 'jon', 'pass' );


  在這些文件的多數據庫版本中,您應該將 SQL 語句加載到一個數據庫中,然后將 users SQL 語句加載到另一個數據庫中。用于在數據庫中查詢與某個特定用戶相關聯的文件的 PHP 代碼如下所示。

  清單 8. Getfiles.php

 

<?php
require_once("DB.php");

function get_user( $name )
{
 $dsn = 'mysql://root:password@localhost/bad_multi1';
 $db =& DB::Connect( $dsn, array() );
 if (PEAR::isError($db)) { die($db->getMessage()); }

 $res = $db->query( "SELECT id FROM users WHERE login=?",array( $name ) );
 $uid = null;
 while( $res->fetchInto( $row ) ) { $uid = $row[0]; }

 return $uid;
}

function get_files( $name )
{
 $uid = get_user( $name );

 $rows = array();

 $dsn = 'mysql://root:password@localhost/bad_multi2';
 $db =& DB::Connect( $dsn, array() );
 if (PEAR::isError($db)) { die($db->getMessage()); }

 $res = $db->query( "SELECT * FROM files WHERE user_id=?",array( $uid ) );
 while( $res->fetchInto( $row ) ) { $rows[] = $row; }
 return $rows;
}

$files = get_files( 'jack' );

var_dump( $files );
?>


  get_user 函數連接到包含用戶表的數據庫并檢索給定用戶的 ID。get_files 函數連接到文件表并檢索與給定用戶相關聯的文件行。
 做所有這些事情的一個更好辦法是將數據加載到一個數據庫中,然后執(zhí)行查詢,比如下面的查詢。

  清單 9. Getfiles_good.php

 

<?php
require_once("DB.php");

function get_files( $name )
{
 $rows = array();

 $dsn = 'mysql://root:password@localhost/good_multi';
 $db =& DB::Connect( $dsn, array() );
 if (PEAR::isError($db)) { die($db->getMessage()); }

 $res = $db->query("SELECT files.* FROM users, files WHERE
users.login=? AND users.id=files.user_id",
array( $name ) );
 while( $res->fetchInto( $row ) ) { $rows[] = $row; }

 return $rows;
}

$files = get_files( 'jack' );

var_dump( $files );
?>


  該代碼不僅更短,而且也更容易理解和高效。我們不是執(zhí)行兩個查詢,而是執(zhí)行一個查詢。

  盡管該問題聽起來有些牽強,但是在實踐中我們通?偨Y出所有的表應該在同一個數據庫中,除非有非常迫不得已的理由。

  問題 4:不使用關系---www.002pc.com

  關系數據庫不同于編程語言,它們不具有數組類型。相反,它們使用表之間的關系來創(chuàng)建對象之間的一到多結構,這與數組具有相同的效果。我在應用程序中看到的一個問題是,工程師試圖將數據庫當作編程語言來使用,即通過使用具有逗號分隔的標識符的文本字符串來創(chuàng)建數組。請看下面的模式。

  清單 10. Bad.sql

 

DROP TABLE IF EXISTS files;
CREATE TABLE files (
 id MEDIUMINT,
 name TEXT,
 path TEXT
);

DROP TABLE IF EXISTS users;
CREATE TABLE users (
 id MEDIUMINT,
 login TEXT,
 password TEXT,
 files TEXT
);

INSERT INTO files VALUES ( 1, 'test1.jpg', 'media/test1.jpg' );
INSERT INTO files VALUES ( 2, 'test1.jpg', 'media/test1.jpg' );
INSERT INTO users VALUES ( 1, 'jack', 'pass', '1,2' );


  系統(tǒng)中的一個用戶可以具有多個文件。在編程語言中,應該使用數組來表示與一個用戶相關聯的文件。在本例中,程序員選擇創(chuàng)建一個 files 字段,其中包含一個由逗號分隔的文件 id 列表。要得到一個特定用戶的所有文件的列表,程序員必須首先從用戶表中讀取行,然后解析文件的文本,并為每個文件運行一個單獨的 SELECT 語句。該代碼如下所示。

  清單 11. Get.php

 

<?php
require_once("DB.php");

function get_files( $name )
{
 $dsn = 'mysql://root:password@localhost/bad_norel';
 $db =& DB::Connect( $dsn, array() );
 if (PEAR::isError($db)) { die($db->getMessage()); }

 $res = $db->query( "SELECT files FROM users WHERE login=?",array( $name ) );
 $files = null;
 while( $res->fetchInto( $row ) ) { $files = $row[0]; }

 $rows = array();

 foreach( split( ',',$files ) as $file )
 {
  $res = $db->query( "SELECT * FROM files WHERE id=?",
  array( $file ) );
  while( $res->fetchInto( $row ) ) { $rows[] = $row; }
 }

 return $rows;
}

$files = get_files( 'jack' );

var_dump( $files );
?>


  該技術很慢,難以維護,且沒有很好地利用數據庫。惟一的解決方案是重新架構模式,以將其轉換回到傳統(tǒng)的關系形式,如下所示。

  清單 12. Good.sql

 

DROP TABLE IF EXISTS files;
CREATE TABLE files (
 id MEDIUMINT,
 user_id MEDIUMINT,
 name TEXT,
 path TEXT
);

DROP TABLE IF EXISTS users;
CREATE TABLE users (
 id MEDIUMINT,
 login TEXT,
 password TEXT
);

INSERT INTO users VALUES ( 1, 'jack', 'pass' );
INSERT INTO files VALUES ( 1, 1, 'test1.jpg', 'media/test1.jpg' );
INSERT INTO files VALUES ( 2, 1, 'test1.jpg', 'media/test1.jpg' );


  這里,每個文件都通過 user_id 函數與文件表中的用戶相關。這可能與任何將多個文件看成數組的人的思想相反。當然,數組不引用其包含的對象 —— 事實上,反之亦然。但是在關系數據庫中,工作原理就是這樣的,并且查詢也因此要快速且簡單得多。清單 13 展示了相應的 PHP 代碼。

  清單 13. Get_good.php

 

<?php
require_once("DB.php");

function get_files( $name )
{
 $dsn = 'mysql://root:password@localhost/good_rel';
 $db =& DB::Connect( $dsn, array() );
 if (PEAR::isError($db)) { die($db->getMessage()); }

 $rows = array();
 $res = $db->query("SELECT files.* FROM users,files WHERE users.login=?
AND users.id=files.user_id",array( $name ) );
 while( $res->fetchInto( $row ) ) { $rows[] = $row; }
 return $rows;
}

$files = get_files( 'jack' );

var_dump( $files );
?>


  這里,我們對數據庫進行一次查詢,以獲得所有的行。代碼不復雜,并且它將數據庫作為其原有的用途使用。

  問題 5:n+1 模式

  我真不知有多少次看到過這樣的大型應用程序,其中的代碼首先檢索一些實體(比如說客戶),然后來回地一個一個地檢索它們,以得到每個實體的詳細信息。我們將其稱為 n+1 模式,因為查詢要執(zhí)行這么多次 —— 一次查詢檢索所有實體的列表,然后對于 n 個實體中的每一個執(zhí)行一次查詢。當 n=10 時這還不成其為問題,但是當 n=100 或 n=1000 時呢?然后肯定會出現低效率問題。清單 14 展示了這種模式的一個例子。

  清單 14. Schema.sql

 

DROP TABLE IF EXISTS authors;
CREATE TABLE authors (
 id MEDIUMINT NOT NULL AUTO_INCREMENT,
 name TEXT NOT NULL,
 PRIMARY KEY ( id )
);

DROP TABLE IF EXISTS books;
CREATE TABLE books (
 id MEDIUMINT NOT NULL AUTO_INCREMENT,
 author_id MEDIUMINT NOT NULL,
 name TEXT NOT NULL,
 PRIMARY KEY ( id )
);

INSERT INTO authors VALUES ( null, 'Jack Herrington' );
INSERT INTO authors VALUES ( null, 'Dave Thomas' );

INSERT INTO books VALUES ( null, 1, 'Code Generation in Action' );
INSERT INTO books VALUES ( null, 1, 'Podcasting Hacks' );
INSERT INTO books VALUES ( null, 1, 'PHP Hacks' );
INSERT INTO books VALUES ( null, 2, 'Pragmatic Programmer' );
INSERT INTO books VALUES ( null, 2, 'Ruby on Rails' );
INSERT INTO books VALUES ( null, 2, 'Programming Ruby' );


  該模式是可靠的,其中沒有任何錯誤。問題在于訪問數據庫以找到一個給定作者的所有書籍的代碼中,如下所示。

  清單 15. Get.php

 

<?php
require_once('DB.php');

$dsn = 'mysql://root:password@localhost/good_books';
$db =& DB::Connect( $dsn, array() );
if (PEAR::isError($db)) { die($db->getMessage()); }

function get_author_id( $name )
{
 global $db;

 $res = $db->query( "SELECT id FROM authors WHERE name=?",array( $name ) );
 $id = null;
 while( $res->fetchInto( $row ) ) { $id = $row[0]; }
 return $id;
}

function get_books( $id )
{
 global $db;

 $res = $db->query( "SELECT id FROM books WHERE author_id=?",array( $id ) );
 $ids = array();
 while( $res->fetchInto( $row ) ) { $ids []= $row[0]; }
 return $ids;
}

function get_book( $id )
{
 global $db;

 $res = $db->query( "SELECT * FROM books WHERE id=?", array( $id ) );
 while( $res->fetchInto( $row ) ) { return $row; }
 return null;
}

$author_id = get_author_id( 'Jack Herrington' );
$books = get_books( $author_id );
foreach( $books as $book_id ) {
 $book = get_book( $book_id );
 var_dump( $book );
}
?>


  如果您看看下面的代碼,您可能會想,“嘿,這才是真正的清楚明了。” 首先,得到作者 id,然后得到書籍列表,然后得到有關每本書的信息。的確,它很清楚明了,但是其高效嗎?回答是否定的?纯粗皇菣z索 Jack Herrington 的書籍時要執(zhí)行多少次查詢。一次獲得 id,另一次獲得書籍列表,然后每本書執(zhí)行一次查詢。三本書要執(zhí)行五次查詢!

  解決方案是用一個函數來執(zhí)行大量的查詢,如下所示。

  清單 16. Get_good.php

 

<?php
require_once('DB.php');

$dsn = 'mysql://root:password@localhost/good_books';
$db =& DB::Connect( $dsn, array() );
if (PEAR::isError($db)) { die($db->getMessage()); }

function get_books( $name )
{
 global $db;

 $res = $db->query("SELECT books.* FROM authors,books WHERE books.author_id=authors.id AND authors.name=?",
 array( $name ) );
 $rows = array();
 while( $res->fetchInto( $row ) ) { $rows []= $row; }
  return $rows;
 }

 $books = get_books( 'Jack Herrington' );
 var_dump( $books );
?>


  現在檢索列表需要一個快速、單個的查詢。這意味著我將很可能必須具有幾個這些類型的具有不同參數的方法,但是實在是沒有選擇。如果您想要具有一個擴展的 PHP 應用程序,那么必須有效地使用數據庫,這意味著更智能的查詢。

  本例的問題是它有點太清晰了。通常來說,這些類型的 n+1 或 n*n 問題要微妙得多。并且它們只有在數據庫管理員在系統(tǒng)具有性能問題時在系統(tǒng)上運行查詢剖析器時才會出現。

  結束語

  數據庫是強大的工具,就跟所有強大的工具一樣,如果您不知道如何正確地使用就會濫用它們。識別和解決這些問題的訣竅是更好地理解底層技術。長期以來,我老聽到業(yè)務邏輯編寫人員抱怨,他們不想要必須理解數據庫或 SQL 代碼。他們把數據庫當成對象使用,并疑惑性能為什么如此之差。

  他們沒有認識到,理解 SQL 對于將數據庫從一個困難的必需品轉換成強大的聯盟是多么重要。如果您每天使用數據庫,但是不熟悉 SQL,那么請閱讀 The Art of SQL,這本書寫得很好,實踐性也很強,可以指導您基本了解數據庫。

熱門評論
最新評論
發(fā)表評論 查看所有評論(0)
昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
字數: 0/500 (您的評論需要經過審核才能顯示)