book

PHP Cookbook

by David Sklar, Adam Trachtenberg

November 2002

Intermediate to advanced

640 pages

16h 33m

English

O'Reilly Media, Inc.

Read now

Unlock full access

PHP Cookbook
Preface
Who This Book Is For
What Is in This Book
Other Resources
Web SitesBooks
Conventions Used in This Book
Programming ConventionsTypesetting Conventions
Comments and Questions
Acknowledgments
David SklarAdam Trachtenberg
1. Strings
Introduction
1.1. Accessing Substrings
SolutionDiscussionSee Also
1.2. Replacing Substrings
ProblemSolutionDiscussionSee Also

1.3. Processing a String One Character at a Time
ProblemSolutionDiscussionSee Also
1.4. Reversing a String by Word or Character
ProblemSolutionDiscussionSee Also
1.5. Expanding and Compressing Tabs
ProblemSolutionDiscussionSee Also
1.6. Controlling Case
ProblemSolutionDiscussionSee Also
1.7. Interpolating Functions and Expressions Within Strings
ProblemSolutionDiscussionSee Also
1.8. Trimming Blanks from a String
ProblemSolutionDiscussionSee Also
1.9. Parsing Comma-Separated Data
ProblemSolutionDiscussionSee Also
1.10. Parsing Fixed-Width Delimited Data
ProblemSolutionDiscussionSee Also
1.11. Taking Strings Apart
ProblemSolutionDiscussionSee Also
1.12. Wrapping Text at a Certain Line Length
ProblemSolutionDiscussionSee Also
1.13. Storing Binary Data in Strings
ProblemSolutionDiscussionSee Also
2. Numbers
Introduction
2.1. Checking Whether a String Contains a Valid Number
ProblemSolutionDiscussionSee Also
2.2. Comparing Floating-Point Numbers
ProblemSolutionDiscussionSee Also
2.3. Rounding Floating-Point Numbers
ProblemSolutionDiscussionSee Also
2.4. Operating on a Series of Integers
ProblemSolutionDiscussionSee Also
2.5. Generating Random Numbers Within a Range
ProblemSolutionDiscussionSee Also
2.6. Generating Biased Random Numbers
ProblemSolutionDiscussionSee Also
2.7. Taking Logarithms
ProblemSolutionDiscussionSee Also
2.8. Calculating Exponents
ProblemSolutionDiscussionSee Also
2.9. Formatting Numbers
ProblemSolutionDiscussionSee Also
2.10. Printing Correct Plurals
ProblemSolutionDiscussion
2.11. Calculating Trigonometric Functions
ProblemSolutionDiscussionSee Also
2.12. Doing Trigonometry in Degrees, not Radians
ProblemSolutionDiscussionSee Also
2.13. Handling Very Large or Very Small Numbers
ProblemSolutionDiscussionSee Also
2.14. Converting Between Bases
ProblemSolutionDiscussionSee Also
2.15. Calculating Using Numbers in Bases Other Than Decimal
ProblemSolutionDiscussionSee Also
3. Dates and Times
Introduction
3.1. Finding the Current Date and Time
ProblemSolutionDiscussionSee Also
3.2. Converting Time and Date Parts to an Epoch Timestamp
ProblemSolutionDiscussionSee Also
3.3. Converting an Epoch Timestamp to Time and Date Parts
ProblemSolutionDiscussionSee Also
3.4. Printing a Date or Time in a Specified Format
ProblemSolutionDiscussionSee Also
3.5. Finding the Difference of Two Dates
ProblemSolutionDiscussionSee Also
3.6. Finding the Difference of Two Dates with Julian Days
ProblemSolutionDiscussionSee Also
3.7. Finding the Day in a Week, Month, Year, or the Week Number in a Year
ProblemSolutionDiscussionSee Also
3.8. Validating a Date
ProblemSolutionDiscussionSee Also
3.9. Parsing Dates and Times from Strings
ProblemSolutionDiscussionSee Also
3.10. Adding to or Subtracting from a Date
ProblemSolutionDiscussionSee Also
3.11. Calculating Time with Time Zones
ProblemSolutionDiscussionSee Also
3.12. Accounting for Daylight Saving Time
ProblemSolutionDiscussionSee Also
3.13. Generating a High-Precision Time
ProblemSolutionDiscussionSee Also
3.14. Generating Time Ranges
ProblemSolutionDiscussionSee Also
3.15. Using Non-Gregorian Calendars
ProblemSolutionDiscussionSee Also
3.16. Program: Calendar
4. Arrays
Introduction
4.1. Specifying an Array Not Beginning at Element 0
ProblemSolutionDiscussionSee Also
4.2. Storing Multiple Elements per Key in an Array
ProblemSolutionDiscussionSee Also
4.3. Initializing an Array to a Range of Integers
ProblemSolutionDiscussionSee Also
4.4. Iterating Through an Array
ProblemSolutionDiscussionSee Also
4.5. Deleting Elements from an Array
ProblemSolutionDiscussionSee Also
4.6. Changing Array Size
ProblemSolutionDiscussionSee Also
4.7. Appending One Array to Another
ProblemSolutionDiscussionSee Also
4.8. Turning an Array into a String
ProblemSolutionDiscussionSee Also
4.9. Printing an Array with Commas
ProblemSolutionDiscussionSee Also
4.10. Checking if a Key Is in an Array
ProblemSolutionDiscussionSee Also
4.11. Checking if an Element Is in an Array
ProblemSolutionDiscussionSee Also
4.12. Finding the Position of an Element in an Array
ProblemSolutionDiscussionSee Also
4.13. Finding Elements That Pass a Certain Test
ProblemSolutionDiscussionSee Also
4.14. Finding the Largest or Smallest Valued Element in an Array
ProblemSolutionDiscussionSee Also
4.15. Reversing an Array
ProblemSolutionDiscussionSee Also
4.16. Sorting an Array
ProblemSolutionDiscussionSee Also
4.17. Sorting an Array by a Computable Field
ProblemSolutionDiscussionSee Also
4.18. Sorting Multiple Arrays
ProblemSolutionDiscussionSee Also
4.19. Sorting an Array Using a Method Instead of a Function
ProblemSolutionDiscussionSee Also
4.20. Randomizing an Array
ProblemSolutionDiscussionSee Also
4.21. Shuffling a Deck of Cards
ProblemSolutionDiscussionSee Also
4.22. Removing Duplicate Elements from an Array
ProblemSolutionDiscussionSee Also
4.23. Finding the Union, Intersection, or Difference of Two Arrays
ProblemSolutionDiscussionSee Also
4.24. Finding All Element Combinations of an Array
ProblemSolutionDiscussionSee Also
4.25. Finding All Permutations of an Array
ProblemSolutionDiscussionSee Also
4.26. Program: Printing an Array in a Horizontally Columned HTML Table
5. Variables
Introduction
5.1. Avoiding == Versus = Confusion
ProblemSolutionDiscussionSee Also
5.2. Establishing a Default Value
ProblemSolutionDiscussionSee Also
5.3. Exchanging Values Without Using Temporary Variables
ProblemSolutionDiscussionSee Also
5.4. Creating a Dynamic Variable Name
ProblemSolutionDiscussionSee Also
5.5. Using Static Variables
ProblemSolutionDiscussionSee Also
5.6. Sharing Variables Between Processes
ProblemSolutionDiscussionSee Also
5.7. Encapsulating Complex Data Types as a String
ProblemSolutionDiscussionSee Also
5.8. Dumping Variable Contents as Strings
ProblemSolutionDiscussionSee Also
6. Functions
Introduction
6.1. Accessing Function Parameters
ProblemSolutionDiscussionSee Also
6.2. Setting Default Values for Function Parameters
ProblemSolutionDiscussionSee Also
6.3. Passing Values by Reference
ProblemSolutionDiscussionSee Also
6.4. Using Named Parameters
ProblemSolutionDiscussionSee Also
6.5. Creating Functions That Take a Variable Number of Arguments
ProblemSolutionDiscussionSee Also
6.6. Returning Values by Reference
ProblemSolutionDiscussionSee Also
6.7. Returning More Than One Value
ProblemSolutionDiscussionSee Also
6.8. Skipping Selected Return Values
ProblemSolutionDiscussionSee Also
6.9. Returning Failure
ProblemSolutionDiscussionSee Also
6.10. Calling Variable Functions
ProblemSolutionDiscussionSee Also
6.11. Accessing a Global Variable Inside a Function
ProblemSolutionDiscussionSee Also
6.12. Creating Dynamic Functions
ProblemSolutionDiscussionSee Also
7. Classes and Objects
Introduction
7.1. Instantiating Objects
ProblemSolutionDiscussionSee Also
7.2. Defining Object Constructors
ProblemSolutionDiscussionSee Also
7.3. Destroying an Object
ProblemSolutionDiscussionSee Also
7.4. Cloning Objects
ProblemSolutionDiscussionSee Also
7.5. Assigning Object References
ProblemSolutionDiscussionSee Also
7.6. Calling Methods on an Object Returned by Another Method
ProblemSolutionDiscussion
7.7. Accessing Overridden Methods
ProblemSolutionDiscussionSee Also
7.8. Using Property Overloading
ProblemSolutionDiscussionSee Also
7.9. Using Method Polymorphism
ProblemSolutionDiscussionSee Also
7.10. Finding the Methods and Properties of an Object
ProblemSolutionDiscussionSee Also
7.11. Adding Properties to a Base Object
ProblemSolutionDiscussion
7.12. Creating a Class Dynamically
ProblemSolutionDiscussionSee Also
7.13. Instantiating an Object Dynamically
ProblemSolutionDiscussionSee Also
8. Web Basics
Introduction
8.1. Setting Cookies
ProblemSolutionDiscussionSee Also
8.2. Reading Cookie Values
ProblemSolutionDiscussionSee Also
8.3. Deleting Cookies
ProblemSolutionDiscussionSee Also
8.4. Redirecting to a Different Location
ProblemSolutionDiscussionSee Also
8.5. Using Session Tracking
ProblemSolutionDiscussionSee Also
8.6. Storing Sessions in a Database
ProblemSolutionDiscussionSee Also
8.7. Detecting Different Browsers
ProblemSolutionDiscussionSee Also
8.8. Building a GET Query String
ProblemSolutionDiscussionSee Also
8.9. Using HTTP Basic Authentication
ProblemSolutionDiscussionSee Also
8.10. Using Cookie Authentication
ProblemSolutionDiscussionSee Also
8.11. Flushing Output to the Browser
ProblemSolutionDiscussionSee Also
8.12. Buffering Output to the Browser
ProblemSolutionDiscussionSee Also
8.13. Compressing Web Output with gzip
ProblemSolutionDiscussionSee Also
8.14. Hiding Error Messages from Users
ProblemSolutionDiscussionSee Also
8.15. Tuning Error Handling
ProblemSolutionDiscussionSee Also
8.16. Using a Custom Error Handler
ProblemSolutionDiscussionSee Also
8.17. Logging Errors
ProblemSolutionDiscussionSee Also
8.18. Eliminating “headers already sent” Errors
ProblemSolutionDiscussionSee Also
8.19. Logging Debugging Information
ProblemSolutionDiscussionSee Also
8.20. Reading Environment Variables
ProblemSolutionDiscussionSee Also
8.21. Setting Environment Variables
ProblemSolutionDiscussionSee Also
8.22. Reading Configuration Variables
ProblemSolutionDiscussionSee Also
8.23. Setting Configuration Variables
ProblemSolutionDiscussionSee Also
8.24. Communicating Within Apache
ProblemSolutionDiscussionSee Also
8.25. Profiling Code
ProblemSolutionDiscussionSee Also
8.26. Program: Website Account (De)activator
8.27. Program: Abusive User Checker
9. Forms
Introduction
9.1. Processing Form Input
ProblemSolutionDiscussionSee Also
9.2. Validating Form Input
ProblemSolutionDiscussionSee Also
9.3. Working with Multipage Forms
ProblemSolutionDiscussionSee Also
9.4. Redisplaying Forms with Preserved Information and Error Messages
ProblemSolutionDiscussionSee Also
9.5. Guarding Against Multiple Submission of the Same Form
ProblemSolutionDiscussionSee Also
9.6. Processing Uploaded Files
ProblemSolutionDiscussionSee Also
9.7. Securing PHP’s Form Processing
ProblemSolutionDiscussionSee Also
9.8. Escaping Control Characters from User Data
ProblemSolutionDiscussionSee Also
9.9. Handling Remote Variables with Periods in Their Names
ProblemSolutionDiscussionSee Also
9.10. Using Form Elements with Multiple Options
ProblemSolutionDiscussionSee Also
9.11. Creating Dropdown Menus Based on the Current Date
ProblemSolutionDiscussionSee Also
10. Database Access
Introduction
10.1. Using Text-File Databases
ProblemSolutionDiscussionSee Also
10.2. Using DBM Databases
ProblemSolutionDiscussionSee Also
10.3. Connecting to a SQL Database
ProblemSolutionDiscussionSee Also
10.4. Querying a SQL Database
ProblemSolutionDiscussionSee Also
10.5. Retrieving Rows Without a Loop
ProblemSolutionDiscussionSee Also
10.6. Modifying Data in a SQL Database
ProblemSolutionDiscussionSee Also
10.7. Repeating Queries Efficiently
ProblemSolutionDiscussionSee Also
10.8. Finding the Number of Rows Returned by a Query
ProblemSolutionDiscussionSee Also
10.9. Escaping Quotes
ProblemSolutionDiscussionSee Also
10.10. Logging Debugging Information and Errors
ProblemSolutionDiscussionSee Also
10.11. Assigning Unique ID Values Automatically
ProblemSolutionDiscussionSee Also
10.12. Building Queries Programmatically
ProblemSolutionDiscussionSee Also
10.13. Making Paginated Links for a Series of Records
ProblemSolutionDiscussionSee Also
10.14. Caching Queries and Results
ProblemSolutionDiscussionSee Also
10.15. Program: Storing a Threaded Message Board
11. Web Automation
Introduction
11.1. Fetching a URL with the GET Method
ProblemSolutionDiscussionSee Also
11.2. Fetching a URL with the POST Method
ProblemSolutionDiscussionSee Also
11.3. Fetching a URL with Cookies
ProblemSolutionDiscussionSee Also
11.4. Fetching a URL with Headers
ProblemSolutionDiscussionSee Also
11.5. Fetching an HTTPS URL
ProblemSolutionDiscussionSee Also
11.6. Debugging the Raw HTTP Exchange
ProblemSolutionDiscussionSee Also
11.7. Marking Up a Web Page
ProblemSolutionDiscussionSee Also
11.8. Extracting Links from an HTML File
ProblemSolutionDiscussionSee Also
11.9. Converting ASCII to HTML
ProblemSolutionDiscussionSee Also
11.10. Converting HTML to ASCII
ProblemSolutionDiscussionSee Also
11.11. Removing HTML and PHP Tags
ProblemSolutionDiscussionSee Also
11.12. Using Smarty Templates
ProblemSolutionDiscussionSee Also
11.13. Parsing a Web Server Log File
ProblemSolutionDiscussionSee Also
11.14. Program: Finding Stale Links
11.15. Program: Finding Fresh Links
12. XML
Introduction
12.1. Generating XML Manually
ProblemSolutionDiscussionSee Also
12.2. Generating XML with the DOM
ProblemSolutionDiscussionSee Also
12.3. Parsing XML with the DOM
ProblemSolutionDiscussionSee Also
12.4. Parsing XML with SAX
ProblemSolutionDiscussionSee Also
12.5. Transforming XML with XSLT
ProblemSolutionDiscussionSee Also
12.6. Sending XML-RPC Requests
ProblemSolutionDiscussionSee Also
12.7. Receiving XML-RPC Requests
ProblemSolutionDiscussionSee Also
12.8. Sending SOAP Requests
ProblemSolutionDiscussionSee Also
12.9. Receiving SOAP Requests
ProblemSolutionDiscussionSee Also
12.10. Exchanging Data with WDDX
ProblemSolutionDiscussionSee Also
12.11. Reading RSS Feeds
ProblemSolutionDiscussionSee Also
13. Regular Expressions
Introduction
13.1. Switching From ereg to preg
ProblemSolutionDiscussionSee Also
13.2. Matching Words
ProblemSolutionDiscussionSee Also
13.3. Finding the nth Occurrence of a Match
ProblemSolutionDiscussionSee Also
13.4. Choosing Greedy or Nongreedy Matches
ProblemSolutionDiscussionSee Also
13.5. Matching a Valid Email Address
ProblemSolutionDiscussionSee Also
13.6. Finding All Lines in a File That Match a Pattern
ProblemSolutionDiscussionSee Also
13.7. Capturing Text Inside HTML Tags
ProblemSolutionDiscussionSee Also
13.8. Escaping Special Characters in a Regular Expression
ProblemSolutionDiscussionSee Also
13.9. Reading Records with a Pattern Separator
ProblemSolutionDiscussionSee Also
14. Encryption and Security
Introduction
14.1. Keeping Passwords Out of Your Site Files
ProblemSolutionDiscussionSee Also
14.2. Obscuring Data with Encoding
ProblemSolutionDiscussionSee Also
14.3. Verifying Data with Hashes
ProblemSolutionDiscussionSee Also
14.4. Storing Passwords
ProblemSolutionDiscussionSee Also
14.5. Checking Password Strength
ProblemSolutionDiscussionSee Also
14.6. Dealing with Lost Passwords
ProblemSolutionDiscussionSee Also
14.7. Encrypting and Decrypting Data
ProblemSolutionDiscussionSee Also
14.8. Storing Encrypted Data in a File or Database
ProblemSolutionDiscussionSee Also
14.9. Sharing Encrypted Data with Another Web Site
ProblemSolutionDiscussionSee Also
14.10. Detecting SSL
ProblemSolutionDiscussionSee Also
14.11. Encrypting Email with GPG
ProblemSolutionDiscussionSee Also
15. Graphics
Introduction
15.1. Drawing Lines, Rectangles, and Polygons
ProblemSolutionDiscussionSee Also
15.2. Drawing Arcs, Ellipses, and Circles
ProblemSolutionDiscussionSee Also
15.3. Drawing with Patterned Lines
ProblemSolutionDiscussionSee Also
15.4. Drawing Text
ProblemSolutionDiscussionSee Also
15.5. Drawing Centered Text
ProblemSolutionDiscussionSee Also
15.6. Building Dynamic Images
ProblemSolutionDiscussionSee Also
15.7. Getting and Setting a Transparent Color
ProblemSolutionDiscussionSee Also
15.8. Serving Images Securely
ProblemSolutionDiscussionSee Also
15.9. Program: Generating Bar Charts from Poll Results
16. Internationalization and Localization
Introduction
16.1. Listing Available Locales
ProblemSolutionDiscussionSee Also
16.2. Using a Particular Locale
ProblemSolutionDiscussionSee Also
16.3. Setting the Default Locale
ProblemSolutionDiscussionSee Also
16.4. Localizing Text Messages
ProblemSolutionDiscussionSee Also
16.5. Localizing Dates and Times
ProblemSolutionDiscussionSee Also
16.6. Localizing Currency Values
ProblemSolutionDiscussionSee Also
16.7. Localizing Images
ProblemSolutionDiscussionSee Also
16.8. Localizing Included Files
ProblemSolutionDiscussionSee Also
16.9. Managing Localization Resources
ProblemSolutionDiscussionSee Also
16.10. Using gettext
ProblemSolutionDiscussionSee Also
16.11. Reading or Writing Unicode Characters
ProblemSolutionDiscussionSee Also
17. Internet Services
Introduction
17.1. Sending Mail
ProblemSolutionDiscussionSee Also
17.2. Sending MIME Mail
ProblemSolutionDiscussionSee Also
17.3. Reading Mail with IMAP or POP3
ProblemSolutionDiscussionSee Also
17.4. Posting Messages to Usenet Newsgroups
ProblemSolutionDiscussionSee Also
17.5. Reading Usenet News Messages
ProblemSolutionDiscussionSee Also
17.6. Getting and Putting Files with FTP
ProblemSolutionDiscussionSee Also
17.7. Looking Up Addresses with LDAP
ProblemSolutionDiscussionSee Also
17.8. Using LDAP for User Authentication
ProblemSolutionDiscussionSee Also
17.9. Performing DNS Lookups
ProblemSolutionDiscussionSee Also
17.10. Checking if a Host Is Alive
ProblemSolutionDiscussionSee Also
17.11. Getting Information About a Domain Name
ProblemSolutionDiscussionSee Also
18. Files
Introduction
18.1. Creating or Opening a Local File
ProblemSolutionDiscussionSee Also
18.2. Creating a Temporary File
ProblemSolutionDiscussionSee Also
18.3. Opening a Remote File
ProblemSolutionDiscussionSee Also
18.4. Reading from Standard Input
ProblemSolutionDiscussionSee Also
18.5. Reading a File into a String
ProblemSolutionDiscussionSee Also
18.6. Counting Lines, Paragraphs, or Records in a File
ProblemSolutionDiscussionSee Also
18.7. Processing Every Word in a File
ProblemSolutionDiscussionSee Also
18.8. Reading a Particular Line in a File
ProblemSolutionDiscussionSee Also
18.9. Processing a File Backward by Line or Paragraph
ProblemSolutionDiscussionSee Also
18.10. Picking a Random Line from a File
ProblemSolutionDiscussionSee Also
18.11. Randomizing All Lines in a File
ProblemSolutionDiscussionSee Also
18.12. Processing Variable Length Text Fields
ProblemSolutionDiscussionSee Also
18.13. Reading Configuration Files
ProblemSolutionDiscussionSee Also
18.14. Reading from or Writing to a Specific Location in a File
ProblemSolutionDiscussionSee Also
18.15. Removing the Last Line of a File
ProblemSolutionDiscussionSee Also
18.16. Modifying a File in Place Without a Temporary File
ProblemSolutionDiscussionSee Also
18.17. Flushing Output to a File
ProblemSolutionDiscussionSee Also
18.18. Writing to Standard Output
ProblemSolutionDiscussionSee Also
18.19. Writing to Many Filehandles Simultaneously
ProblemSolutionDiscussionSee Also
18.20. Escaping Shell Metacharacters
ProblemSolutionDiscussionSee Also
18.21. Passing Input to a Program
ProblemSolutionDiscussionSee Also
18.22. Reading Standard Output from a Program
ProblemSolutionDiscussionSee Also
18.23. Reading Standard Error from a Program
ProblemSolutionDiscussionSee Also
18.24. Locking a File
ProblemSolutionDiscussionSee Also
18.25. Reading and Writing Compressed Files
ProblemSolutionDiscussionSee Also
18.26. Program: Unzip
See Also
19. Directories
Introduction
19.1. Getting and Setting File Timestamps
ProblemSolutionDiscussionSee Also
19.2. Getting File Information
ProblemSolutionDiscussionSee Also
19.3. Changing File Permissions or Ownership
ProblemSolutionDiscussionSee Also
19.4. Splitting a Filename into Its Component Parts
ProblemSolutionDiscussionSee Also
19.5. Deleting a File
ProblemSolutionDiscussionSee Also
19.6. Copying or Moving a File
ProblemSolutionDiscussionSee Also
19.7. Processing All Files in a Directory Recursively
ProblemSolutionDiscussionSee Also
19.8. Getting a List of Filenames Matching a Pattern
ProblemSolutionDiscussionSee Also
19.9. Processing All Files in a Directory
ProblemSolutionDiscussionSee Also
19.10. Making New Directories
ProblemSolutionDiscussionSee Also
19.11. Removing a Directory and Its Contents
ProblemSolutionDiscussionSee Also
19.12. Program: Web Server Directory Listing
19.13. Program: Site Search
20. Client-Side PHP
Introduction
20.1. Parsing Program Arguments
ProblemSolutionDiscussionSee Also
20.2. Parsing Program Arguments with getopt
ProblemSolutionDiscussionSee Also
20.3. Reading from the Keyboard
ProblemSolutionDiscussionSee Also
20.4. Reading Passwords
ProblemSolutionDiscussionSee Also
20.5. Displaying a GUI Widget in a Window
ProblemSolutionDiscussionSee Also
20.6. Displaying Multiple GUI Widgets in a Window
ProblemSolutionDiscussionSee Also
20.7. Responding to User Actions
ProblemSolutionDiscussionSee Also
20.8. Displaying Menus
ProblemSolutionDiscussionSee Also
20.9. Program: Command Shell
20.10. Program: Displaying Weather Conditions
21. PEAR
Introduction
21.1. Using the PEAR Package Manager
ProblemSolutionDiscussion
21.2. Finding PEAR Packages
ProblemSolutionDiscussionSee Also
21.3. Finding Information About a Package
ProblemSolutionDiscussionSee Also
21.4. Installing PEAR Packages
ProblemSolutionDiscussionSee Also
21.5. Installing PECL Packages
ProblemSolutionDiscussionSee Also
21.6. Upgrading PEAR Packages
ProblemSolutionDiscussionSee Also
21.7. Uninstalling PEAR Packages
ProblemSolutionDiscussionSee Also
21.8. Documenting Classes with PHPDoc
ProblemSolutionDiscussionSee Also
Index
Colophon

Content preview from PHP Cookbook

11.8. Extracting Links from an HTML File

Problem

You need to extract the URLs that are specified inside an HTML document.

Solution

Use the pc_link_extractor( ) function shown in Example 11-2.

Example 11-2. pc_link_extractor( )

function pc_link_extractor($s) {
  $a = array();
  if (preg_match_all('/<a\s+.*?href=[\"\']?([^\"\' >]*)[\"\']?[^>]*>(.*?)<\/a>/i',
                     $s,$matches,PREG_SET_ORDER)) {
    foreach($matches as $match) {
      array_push($a,array($match[1],$match[2]));
    }
  }
  return $a;
}

For example:

$links = pc_link_extractor($page);

Discussion

The pc_link_extractor( ) function returns an array. Each element of that array is itself a two-element array. The first element is the target of the link, and the second element is the text that is linked. For example:

$links=<<<END
Click <a href="http://www.oreilly.com">here</a> to visit a computer book 
publisher. Click <a href="http://www.sklar.com">over here</a> to visit 
a computer book author.
END;

$a = pc_link_extractor($links);
print_r($a);
Array
               (
                   [0] => Array
                       (
                           [0] => http://www.oreilly.com
                           [1] => here
                       )
                   [1] => Array
                       (
                           [0] => http://www.sklar.com
                           [1] => over here
                       )
               )

The regular expression in pc_link_extractor( ) won’t work on all links, such as those that are constructed with JavaScript or some hexadecimal escapes, but it should function on the majority of reasonably well-formed HTML.